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Depuis deux ans, mon ancien directeur de thèse et ami Michel Vaugon a entrepris 
de comprendre les intuitions physiques qui ont conduit à l'axiomatique de la rela- 
tivité générale tout en gardant un langage de mathématicien et plus précisément 
de géomètre. Ses notes, manuscrites, sont à mon sens d'une clarté remarquable et 
je le remercie chaleureusement de me les avoir fournies. Cela a été l'occasion pour 
moi de comprendre ces notions, qui m'étaient étrangères bien que mes travaux de 
recherche aient des liens importants avec le relativité générale. J'ai commencé à 
écrire ce texte en suivant ses notes, non pas pour améliorer son travail, mais pour 
m'approprier ces notions et les traduire dans mon propre langage. D'ailleurs, des 
cinq premiers chapitres, je ne peux revendiquer qu'une part infime de la forme et 
quelques remarques. Même si la suite est plus personnelle, je tenais à ce que son 
nom apparaisse dans le titre parce que, sans lui, ce texte n'aurait vu le jour. 

Par la suite, j'ai eu envie de poursuivre son travail, d'approfondir mes connais- 
sances en physique et d'étudier quelques problèmes mathématiques provenant de 
la relativité générale, en les replaçant dans leur cadre physique. En particulier, je 
présente les équations de contraintes provenant du problème de Cauchy en relati- 
vité générale, les problèmes de masse positive et moment-énergie positif provenant 
de l'étude des systèmes isolés et l'inégalité de Penrose provenant de la conjecture 
de la censure cosmique. Je termine par un chapitre sur les ondes gravitation- 
nelles qui sont au coeur de projets internationaux actuels visant à les détecter 
expérimentalement . 

Ce texte est à bien des égards imprécis : beaucoup de démonstrations ne sont 
pas écrites, quelques approximations mathématiques y sont faites, les références 
bibliographiques sont très incomplètes et ma relecture est bien moins sérieuse que 
si j'avais l'intention de le publier. Mon but est simplement de donner un support 
à un géomètre qui veut comprendre les bases physiques de la relativité générale 
dans un langage qui lui est familier. 

J'ai essayé dans tout le texte de ponctuer la discussion par des remarques d'ordre 
"physique". N'étant pas physicien, il est probable que j'ai commis des erreurs. Que 
tout lecteur plus averti que moi n'hésite pas à me les signaler. 

Pour finir, voici quelques références de base pour le lecteur désireux d'approfondir 
le sujet : d'abord les incontournables livres de Hawking-Ellis |Haw73j . de Wald 
[Wa84] et de Choquet-Bruhat [CB09]. Bien évidemment, la liste est très loin 
d'être exhaustive. Pour les chapitres sur les trous noirs et les ondes gravitation- 
nelles, j'ai utilisé respectivement la thèse de N. Vasset [Va09j sur laquelle je suis 
tombé complètement par hasard sur internet et les notes de cours de Master 2 
d'Eric Gourgoulhon [GolOj qui sont deux textes que je trouve d'une clarté remar- 
quable. Pour ceux qui voudront en savoir plus sur les problèmes mathématiques 
actuels provenant de la relativité générale, je viens juste de découvrir le preprint de 
Chrusciel, Galloway et Pollack [CGPlOj qui résume les avancées récentes dans le 
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domaine et qui, même si je n'ai pas encore eu le temps de m'y plonger sérieusement, 
me paraît particulièrement intéressant. 
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CHAPITRE I 



Quelques expériences fictives 

Ce chapitre permet de montrer comment à partir d'observations simples, on peut 
rapidement faire du calcul relativiste et même aboutir à la célèbre formule E = 
me 2 . Son but est uniquement culturel et ne servira pas dans la suite du texte. Le 
lecteur pressé peut donc commencer la lecture directement au chapitre suivant. 

La théorie de la relativité est née d'une observation qui va à l'encontre de toutes 
nos intuitions : la vitesse de la lumière est la même par rapport à n'importe quel ob- 
servateur. C'est un fait observé en 1887 par Michelson et Morley et qui se retrouve 
par le calcul (voir le Paragraphe |2] du Chapitre HXj) . Imaginons par exemple qu'un 
photon passe devant un observateur à c km/h. Imaginons qu'un deuxième obser- 
vateur aille exactement dans la même direction que le photon mais à (c — 1) km/h. 
Pour le sens commun, si ce deuxième observateur mesure la vitesse du photon, il 
doit trouver 1 km/h. Or, expérimentalement, il est démontré que cet observateur 
va trouver lui aussi une vitesse de c km/h. En particulier, les lois habituelles de 
la mécanique classique ne peuvent pas être vraies, d'où la nécessité de trouver un 
modèle de l'espace-temps qui prenne en compte ce phénomène tout en gardant 
"approximativement" (c'est-à-dire pour tout ce qui se passe à l'échelle humaine) 
les lois de la mécanique classique. 

Dans ce premier chapitre, on explique comment, avant même de chercher un bon 
modèle, on peut déduire de cette observation plusieurs conclusions intéressantes 
grâce à des raisonnements simples. 



1. Temps et longueurs 

Prenons un observateur A qui se trouve dans un train qui avance à v mètres/seconde 
par rapport au quai et dont les wagons ont une longueur de l mètres. Prenons aussi 
un observateur B qui regarde passer le train depuis le quai. Maintenant, suppo- 
sons qu'un photon parte de l'arrière du wagon et qu'il parcoure ce wagon en un 
temps de t secondes. Pour l'observateur A, le photon a parcouru / mètres en t 
secondes soit une vitesse de l/t mètres/seconde. Maintenant, pour B le photon a 
parcouru en t secondes l mètres plus la distance parcourue par le train en t se- 
condes soit d = l + vt. Ainsi pour l'observateur B, le photon va à (l+vt)/t = l/t + v 
mètres/seconde. Puisqu'on trouve des vitesses différentes pour les deux observa- 
teurs alors que l'expérience dit au contraire qu'on doit trouver les mêmes, c'est 
qu'il y a une erreur dans le raisonnement. En fait, on a considéré que 
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I. QUELQUES EXPÉRIENCES FICTIVES 



(1) le temps mesuré par A et B pour que le photon parcoure le wagon étaient 
les mêmes (égaux à t). 

(2) La longueur du wagon mesurée par A et B était la même. 

Pour arriver à un modèle fidèle à la réalité, il faut donc remettre en cause ces deux 
principes. Bien sûr, ces différences ne se feront sentir qu'à des vitesses élevées. Un 
observateur humain qui observe ce qui se passe autour de lui ne se rendra pas 
compte de ces différences de mesure. 

Donc, pour la suite, on supposera que le temps entre deux événements ou la lon- 
gueur d'un objet dépend de l'observateur qui le mesure. Se pose aussi le problème 
de la simultanéité entre deux événements qui dépendra elle aussi de l'observateur. 

Grandeurs conservées quel que soit l'observateur. Comme on l'a expliqué, 
on doit remettre en cause les notions de temps et de longueur mais on ne doit pas 
le faire n'importe comment. Par exemple, une longueur mesurée perpendiculaire- 
ment au déplacement ne doit pas dépendre de l'observateur. En effet, supposons 
par exemple que ces longueurs se contractent quand la vitesse augmente (un rai- 
sonnement analogue se fait si on suppose que les distances s'allongent) et reprenons 
le cas du train sur lequel se trouve l'observateur A alors que l'observateur B est 
resté sur le quai. 

- Plaçons nous d'abord du point de vue de l'observateur A. Pour lui le train est 
immobile alors que les rails ont une vitesse v non nulle. Donc la largeur des 
rails doit être plus petite que l'écartement des roues du train. Autrement dit, les 
roues du train laissent des traces à l'extérieur des rails. 

- Pour l'observateur B, c'est le train qui avance et donc l'écartement de ses roues 
doit être plus petit que l'écartement des rails : les traces des roues du train 
doivent être à l'intérieur des rails. 

Comme les traces laissées par le train ne peuvent pas être à la fois à l'extérieur et 
à l'intérieur des rails, c'est que l'écartement des rails (ou des roues du train) doit 
être le même pour les deux observateurs A et B. 

On pourrait imaginer une deuxième expérience pour prouver que les distances me- 
surées dans le sens du déplacement ne dépendent pas non plus de l'observateur 
(mais comme on va le voir, ce raisonnement est faux) : les mêmes observateurs A 
et B ont chacun une règle graduée dans les mains. Au moment où ils se croisent, 
l'observateur A colle sa règle sur celle de l'observateur B placée dans le sens du 
déplacement par exemple dans un bac à sable posé sur le quai. Par le même genre 
de raisonnement que ci-dessus, on peut se dire qu'on arrive à une absurdité (pour 
B la marque laissée par sa règle dans le sable doit être plus grande que celle de A 
et inversement). Il y a un problème dans cet argument : pour laisser une marque, 
l'observateur A doit poser sa règle dans le sable pendant un intervalle de temps 
certes très court mais non nul. Or pour B, cet intervalle de temps n'est pas le 
même, il est plus long. En résumé, dans cette expérience, la marque laissée par la 
règle de A sera plus longue que celle laissée par la règle B mais pour deux raisons 
différentes : du point de vue de A, parce que sa règle est plus longue et du point 
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du vue de B parce que A a laissé sa règle un certain temps dans le sable. 



Temps et distance pour deux observateurs. On va maintenant imaginer deux 
expériences qui permettent de préciser les différences de mesure de temps et de 
distance dans le sens du déplacement pour deux observateurs. 

(f) Reprenons toujours nos deux observateurs A (dans le train) et B (sur le 
quai). Notons v la vitesse du train par rapport au quai. Imaginons qu'un 
photon fasse un aller-retour (plancher du wagon)- (plafond du wagon). 
Notons h la hauteur du plafond par rapport au plancher du train (h 
est la même pour A et B puisque c'est une distance qui est mesurée 
perpendiculairement au déplacement). 

- A mesure le temps t A pour cet aller-retour du photon. Pour lui le 
photon a parcouru la distance de 2h. Donc la vitesse du photon est 

- B mesure le temps ts pour le même trajet. Mais de son point de 
vue, le photon n'a pas un parcours vertical puisque le train avance. 
Plus précisément en hauteur il a parcouru 2h et horizontalement 
vts- D'après Pythagore, il a parcouru a/4/i 2 + v H\ ce qui donne 

y/4h 2 +V 2 t% 



pour le photon une vitesse c 2 



t B 







h 1 \ 





Trajet du photon vu par A 



Trajet du photon vu par B 



Figure 1 . Calcul du temps mesuré par deux observateurs 

Maintenant, comme la vitesse de la lumière est constante par rapport à 
n'importe quel observateur, on a C\ = c 2 = c et on trouve que 

2h 

t A = — 

c 

2h 



^/Ah? + v 2 tj 



1- 



Comme c = 



2,2 



, on trouve que 



t B - 



t A 



v 

1 " -7 t B . 



On admet donc la règle suivante : 



Règle 1 : Soient deux observateurs A et B qui se déplacent à vitesse 
constante v l'un par rapport à l'autre. On considère deux événements qui 
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I. QUELQUES EXPÉRIENCES FICTIVES 



se passent au même endroit pour A. Alors si on note respectivement 
tA et ts les temps mesurés entre ces deux événements par A et B, on a 



Remarque 1.1. Il est très important de noter que ces événements doivent 
se passer au même endroit pour l'un des observateurs (d'où la nécessité 
de considérer un aller- retour du photon). Sans cela, la règle dirait aussi 

que ts = \y/l — P tA, ce qui est faux bien sûr. Le point 1 de la Remarque 
IL~2l ci-dessous illustre aussi la nécessité de considérer de tels événements. 

Avec le même raisonnement, on peut aussi en déduire une règle avec des 
hypothèses un peu plus générales, qui nous servirons pour la suite : 



Règle 1' : Soient deux observateurs A et B qui se déplacent à vitesse 
constante v l'un par rapport à l'autre. On considère deux événements qui 
se passent à deux endroits X et Y avec (XY) perpendiculaire au mou- 
vement pour A (attention, cette notion dépend de l'observateur^). 

Alors si on note respectivement t a et tu les temps mesurés entre ces deux 

événements par A et B, on a t& — \l 1 — ^ t#- 



(2) Maintenant, considérons que le photon fait un aller-retour (arrière du 
wagon)- (avant du wagon). Cette fois, la longueur dépend de l'observateur. 
Notons Ia (resp. Ib) la longueur du wagon mesurée par A (resp. par B) 
et conservons v pour sa vitesse. 

- L'observateur A mesure un temps tA pour cet aller- retour. La dis- 
tance parcourue par le photon pendant ce temps est 21. Donc sa 
vitesse est c = 

- Pour B, séparons le trajet aller du trajet retour. Notons t' B (resp. 
t" B ) le temps mesuré par B pour l'aller (resp. le retour). Pour B, la 
distance parcourue par le photon sur l'aller est Ib + vt' B (longueur 
du wagon plus distance parcourue par le wagon pendant le trajet 
aller). Pour le retour la distance est Ib — vt" B . 




Figure 2. Calcul des longueurs dans le sens du mouvements me- 
surées par deux observateurs 



On a donc 



Ib + vt' B l B - vt" n 



t B 'i 



2. MASSE ET IMPULSION 11 

De cette équation, on tire t' B = 1b+ ^ b c'est-à-dire t' B = j^. De même, 
t B = -^f-. D'après la Règle 1 ci-dessus, on a 





f 2 
cr 




V 2 










2 





(t'„ + t" B ) 



1 + -!-nb 



Ainsi, 



c — v c + v 
h- 



_ct A _ 

lA — — — , lR- 
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On en déduit la règle suivante : 

Règle 2 : Soient deux observateurs A et B qui se déplacent l'un par rap- 
port à l'autre à vitesse constante et soit [PQ] un segment fixe pour A 
et parallèle au mouvement. Alors, les distances Ia et l B entre P et Q 
mesurées respectivement par A et B sont liées par Ia = -, 1 2 Ib- 



Remarque 1.2. 



(1) Encore une fois, pour appliquer la règle qui lie les temps mesurés par 
deux observateurs, il faut bien vérifier que ces événements se passent au 
même endroit pour l'un des observateurs. En effet, dans cette expérience, 
les temps des trajets aller et retour mesurés par A sont tous les deux de 
t^/2. En appliquant la règle de comparaison de temps, on a envie de dire 

que t A /2 = \Jl-$ t' B et t A /2 = t" B . Cela conduit à t' B = t B , 

ce qui est faux (sinon, la vitesse du photon mesuré par B n'est pas la 
même sur l'aller et le retour). De même, dans la règle de comparaison 
des longueurs, il est important que le segment [PQ] mesuré soit fixe par 
rapport à l'un des observateurs. 

(2) De ces raisonnements, on peut facilement déduire des règles de comparai- 
son de temps lorsque deux événements ne se passent pas au même endroit 
ou de comparaison de longueur pour un segment quelconque. Ces règles 
sont appelées transformations de Lorentz. 

2. Masse et impulsion 

En mécanique classique, considérons un objet q de masse m animé dans un repère 
(c'est-à-dire pour un observateur galiléen donné) d'une vitesse lï. 

Définition. Le vecteur := ralï est appelé quantité de mouvement ou impulsion 
de l'objet q. 
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I. QUELQUES EXPÉRIENCES FICTIVES 



Soit maintenant un système composé de n objets çi, • • • , q n de quantités de mou- 
vement respectives p i, • • • , n . Alors, une loi fondamentale de la dynamique en 
mécanique classique est 



Loi de conservation de quantité de mouvement : la quantité de mouve- 
ment du système défini par ~pî = ~$ \ + • • • + ~$ n est constante avec le temps. En 
particulier, elle est conservée lors des chocs entre les objets du système. 

On va supposer que cette loi, basée sur l'expérience, est toujours valide en relati- 
vité. Mais pour cela, il va falloir préciser les choses, puisque les notions de temps 
et de distance sont remises en cause. Dans ce but, nous reprenons nos deux obser- 
vateurs A (dans le train) et B (sur le quai). Chacun va lancer une pierre sphérique 
(ça pour A et g# pour B) de masse m perpendiculairement au mouvement et avec 
une vitesse V de manière à ce que les deux pierres se rencontrent. Pour l'obser- 
vateur B on travaille dans un repère (Bxy) où l'axe (Bx) est parallèle aux rails 
et (By) est orthogonal aux rails. Pour l'observateur A, on travaille dans le repère 
(Axy) dont seule l'origine est différente : on prend A à la place de B. Autrement 
dit, le repère (Axy) se déplace à la vitesse constante v par rapport au repère (Bxy). 



Avant le choc, 

- L'observateur A voit la pierre ça animée de la vitesse (exprimée dans (Axy)) 





V 



tandis que l'observateur B voit la même pierre animée de la vitesse (exprimée 
dans (Bxy)) 

où v est la vitesse du train et V est à calculer. 

Par symétrie de la situation, l'observateur A voit la pierre qs animée de la vitesse 
tandis que l'observateur B voit la même pierre animée de la vitesse 



1î 





-V 



(on a bien sûr arbitrairement choisi une orientation des axes). 

Calcul de V : V est la composante perpendiculaire au train du vecteur vitesse de 
la pierre qA vue par B. Regardons le temps que met la pierre qA pour parcourir une 
distance / sur l'axe perpendiculaire aux rails (l'axe de y. On oublie les composantes 
dans l'autre direction). D'après le paragraphe précédent, cette distance ne dépend 
pas de l'observateur. Notons tA (resp. ts) le temps mesuré par A (resp. par B) 
pour que la pierre parcoure cette distance l. D'après la Règle 1' du paragraphe 

précédent, on a tA = — p ts- D'autre part, on a V = et V = On 



2. MASSE ET IMPULSION 
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Figure 3. Quantité de mouvement relativiste 

obtient ainsi que 



y = ^i-£ (i.3) 

Après le choc : on considère bien sûr que le choc est élastique. On remarque que 
les composantes des vitesses selon l'axe des x n'est pas modifiée. Regardons main- 
tenant les composantes des vitesses sur l'axe des y. Par symétrie de la situation, 
A et B doivent voir revenir leur propre pierre à la même vitesse. Si cette vitesse 
est différente de celle avant le choc (par exemple strictement supérieure à V) alors 
le système a gagné de l'énergie ce qui va à l'encontre des lois physiques. Donc A 
et B doivent voir revenir leur pierre avec la vitesse V. Autrement dit, 

- L'observateur A voit la pierre ça animée de la vitesse 



A 





-V 



tandis que l'observateur B voit la même pierre animée de la vitesse 



v 

-V 



l'observateur A voit la pierre qs animée de la vitesse 



V 

V 



tandis que l'observateur B voit la même pierre animée de la vitesse 




V 



Pour l'observateur A, vérifions si la loi de conservation de quantité de mouvement 
de la mécanique classique est toujours valable pour le système (ça, 9s)- On doit 
avoir 

Or ce n'est pas le cas puisque la deuxième coordonnée donne m(V — V) = 
m(V — V). D'où vient l'erreur de raisonnement? La réponse est simple : on a 
considéré que les masses des pierres qA et qs étaient les mêmes du point de vue 
des observateurs A et B. Or il semble raisonnable de remettre en cause ce prin- 
cipe. En effet, supposons qu'un objet conserve la même masse quelle que soit sa 
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I. QUELQUES EXPÉRIENCES FICTIVES 



vitesse. Il suffira d'une quantité finie d'énergie pour accélérer la particule à n'im- 
porte quelle vitesse choisie, y compris à une vitesse plus grande que celle de la 
lumière. Or, d'après les formules trouvées au paragraphe précédent, la vitesse de 
la lumière est une barrière infranchissable. L'un des moyens d'expliquer ce fait est 
de supposer que la masse d'un objet tend vers l'infini quand sa vitesse tend vers 
celle de la lumière. 



Revenons à notre problème. En mécanique relativiste, on va toujours supposer que 
la quantité de mouvement est le produit de la masse par la vitesse mais on va aussi 
supposer que la masse d'un objet vu par un observateur dépend de sa vitesse par 
rapport à cet obervateur. Notons V ce vecteur vitesse. On va dire que sa masse 
est une fonction de notée mp. On va chercher cette fonction de manière à ce 
que la quantité de mouvement soit conservée après le choc c'est-à-dire de manière 
à avoir l'égalité 

On remarque que cette égalité est vérifiée si pour une vitesse et un objet de 
masse m (pour donner un sens à la masse d'un objet, il faut comprendre ce terme 
comme étant sa masse au repos, c'est-à-dire à vitesse nulle), on a 

m 

(où || V^|| est la norme euclidienne de V^). En effet, l'égalité de la première co- 
ordonnée est clairement vérifiée. Par ailleurs, pour la deuxième coordonnée, en 
utilisant (1I.3|) . on a 

V V „ V V 

+ 



Cette hypothèse faite sur la masse semble valable dans la mesure où elle tend vers 
+00 si la vitesse tend vers c. 



En résumé, on retiendra : 



Soit q un objet de masse m (au repos) vu par un observateur A. On suppose que 
q a une vitesse par rapport à A. Alors sa masse vue par A est 

m h k\ 

= (1.5) 



et sa quantité de mouvement est 



t 



Avec ces définitions, on garde la loi de conservation de quantité de mouvement 
énoncée ci-dessus dans le cadre de la mécanique classique. 



3. LA FORMULE E = me 2 . 
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Le raisonnement ci-dessus est, d'un point de vue mathématique en tout cas, beau- 
coup moins rigoureux que ceux donnés dans le paragraphe précédent pour établir 
les Règles 1, 1' et 2. Néanmoins, les mesures physiques permettent de vérifier ces 
lois avec une grande précision. 

3. La formule E = me 2 . 

L' énergie est par définition la capacité d'un système modifier un état, à produire 
un travail entraînant un mouvement, de la lumière ou de la chaleur. La formule 
E = me 2 apparaît déjà dans les travaux de Poincaré et dit qu'une particule au 
repos possède de par sa masse, une énergie interne due aux forces d'interaction 
entre particules. L'intuition provient de la remarque expérimentale suivante : si un 
corps émet une énergie (par exemple par rayonnement) E, on mesure que sa masse 
diminue de ^ d'ôu l'idée que cette masse m se soit transformée en énergie avec la 
relation m = ^. L'étude de cette grandeur physique joue un rôle fondamentale en 
relativité en raison de la loi suivante : 

Loi de conservation de l'énergie : l'énergie totale d'un système qui n'a pas 
d'échange avec l'extérieur est constante avec le temps. 

En particulier, tout comme l'impulsion définie dans le paragraphe précédent, cette 
quantité est une intégrale première du système ce qui se définit parfaitement en 
mathématiques. 

Maintenant essayons de déduire la formule E = me 2 de la discussion précédente. 
D'abord, il paraît naturel de penser que l'énergie au repos d'une particule doit être 
proportionnelle à sa masse. Autrement dit, pour une particule de masse au repos 
mo, on a E = km® pour k G M si la particule est immobile. Changeons maintenant 
d'observateur. Si ce nouvel observateur mesure l'énergie de la particule, il doit 
trouver la même valeur à laquelle s'ajoute l'énergie cinétique de la particule. Par 
contre, le résultat trouvé sera toujours proportionnel à sa masse m observée. On a 
aussi envie de dire que ce coefficient de proportionnalité doit être universel. On fera 
donc l'hypothèse suivante : l'énergie totale d'une particule de masse m mesurée 
par un observateur (liée à sa masse au repos par la formule (1I.5P ) est de la forme 
km où k 6 R. On vient de dire que l'énergie totale de la particule était son énergie 
interne (i.e. son énergie au repos) à laquelle s'ajoute son énergie cinétique. En 
d'autres termes, onai? = km = kmo + E c ou encore 

E c = k(m — mo)- (1.6) 

Calcul de k : nous aurons besoin de deux lois fondamentales de la mécanique 
classique : 

(1) Soit q un objet de masse m. Notons ~ct(t) son accélération à l'instant t. 
Alors mot(t) = F* où ~f(t) est la résultante des forces qui s'appliquent à 
q à l'instant t. 
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(2) La différence d'énergie cinétique (c'est-à-dire uniquement due à sa vitesse) 

de l'objet q entre deux instants est égale au travail de la force ~$ qui 
s'applique sur q le long de sa trajectoire. 



La deuxième loi n'a, a priori, aucune raison d'être remise en question en relativité. 
Par contre, la première loi n'est pas satisfaisante puisque la masse dépend du 
temps. On remarque cependant que m~ct(t) n'est autre que la dérivée de la quantité 
de mouvement en fonction du temps. Il paraît plus naturel de garder cette formule 
en relativité : jf${t) = ï^(£). On rappelle que le travail d'une force sur une 



trajectoire c : [a, b] — > R 3 est donné par 



{f(c(t)),c'(t))dt 



où ï^(c(t)) est la force qui s'applique en c(t) et où (•, •) est le produit scalaire eucli- 
dien. Soit donc un objet q de masse au repos m soumis à une force F constante. 
A l'instant t = supposons que cette particule est au repos. On note E c l'énergie 
cinétique de la particule à l'instant t = 1, ~${t) la quantité de mouvement à l'ins- 
tant t, m(t) la masse à l'instant t et v (t) la vitesse à l'instant t. On remarque que 
le vecteur vitesse est en tout point proportionnel à F . Avec les lois 1 et 2, on 
obtient 



E c = f (P,c'(t))dt 
Jo 

= / (mv)'vdt car ||c'(i)|| = v(t) 
Jo 

= / (mv 2 )' — mv'vdt 
Jo 

= m(l)t> 2 (l) — / mv'vdt. 
Jo 



En utilisant la valeur de la masse trouvée ci-dessus 
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Posons maintenant u = v(t) dans l'intégrale ci-dessus. On a alors 



E P . 



m 



v(l) 2 



-.v(lf 



v(l) 



m u 



-.du 



m 



Kl) 2 



=«dr + 



c moA/1 



u- 



"(1) 



m 



2 2 

-.c — m c 



v(l) 2 
c 2 

= (m(l) - m(0))c 2 . 

En comparant ce résultat avec (11.6^ . on obtient que k = c 2 ce qui donne que 



l'énergie totale d'une particule au repos de masse m est E = me 



CHAPITRE II 



Modélisation de l'espace-temps 

1. En mécanique classique 

Modélisation En mécanique classique, l'univers est modélisé par un espace affine 
Ai de dimension 4 muni d'une forme quadratique T sur E := M. de signature 
(+,0,0,0). 

Remarque II. 7. On préfère prendre un espace affine plutôt que M 4 , ce qui évite 
d'avoir un point base et des directions privilégiées. 

Orientation en temps : Comme les vecteurs isotropes (T(v) = ) forment un 
hyperplan de E, l'ensemble E\{v G E\T{v) = 0} a exactement deux composantes 
connexes. Choisissons l'une d'elles une fois pour toutes et notons-la E + . Ce sont 
les directions dites positives. 

Dans tout le paragraphe, b désignera la forme bilinéaire symétrique associée à T. 
Définition. 

(1) Un observateur est une courbe de genre temps i.e. telle qu'il existe une 
paramétrisation c : / — > Ai (I est un intervalle réel) tel que pour tout 

t e I, T(c'(t)) ^ 0. 

(2) Un observateur galiléen est une droite non isotrope. 

Considérer les observateurs galiléens parmi tous les observateurs est naturel pour- 
tant, physiquement cela pose un problème. Cela signifie qu'il y a des observateurs 
privilégiés dans l'univers. Qui sont-ils? Il faut remarquer que si l'on connaît un 
observateur galiléen, on les connaît tous. 

Choisissons maintenant un produit scalaire g sur ker(T) = {y G E\b(v, x) = Va; G 
E}. Notons || • || la norme associée. On peut définir naturellement : 

Définition. 

(1) Soit A, B G Ai. On dit que A et B sont simultanés si G ker(T). "Etre 
simultanés" est une relation d'équivalence dont les classes sont de la forme 
A + ker(T). Ce sont des hyperplans affines qui physiquement, représentent 
l'univers à un instant donné. 

(2) Lorsque A,BeAi sont simultanés, on peut calculer leur distance : 

d(A,B) = \\A~È\\. 

19 
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(3) Le temps qui sépare A,B G Ai est donné par tab = y T(ÂÊ). Autrement 
dit, deux points sont simultanés si et seulement si tab = 0. 

Considérons un observateur galiléen D dirigé par un vecteur %d unitaire (T{i£>) = 
1) et orienté positivement. Si l'on fixe une origine A £ D (on notera Da), on a un 
isomorphisme naturel 

' Ai ->■ ker(T) x R 
B H> (lï,t) 

où lï, t sont déterminés par l'écriture unique A~È = lï + tio- Prendre une origine 
consiste à définir pour D un temps t = 0. Pour Da, V univers observable à l'instant 
test^(ker(T)x{t}). 



Paramétrisation normale positive d'un observateur 

(on dit aussi paramétrisation par le temps). 

Soit D un observateur. Soit c : / — > Ai (I est un intervalle de R) une pa- 
ramétrisation de D telle que T(c'{t)) ne s'annule jamais sur I. Quitte à remplacer 
c(t) par c(—t), on peut supposer qu'en tout point c'(t) G E + . Posons s(t) = 
J t * \jT(d{u))du où to est un point fixé de /. On voit que s est un difféomorphisme 
de / sur l'intervalle J := s(I). Posons maintenant C = c o s -1 . On voit que pour 
tout t G J, 

T(C'(t)) = 1 et C'(t) G E + . 

En effet, 

T{C\t)) = T(c>(s-\t))(s-iy(t)) = T(^||). 

Le résultat est maintenant clair puisque s'(t) = \/T{d (t)). Une telle paramétrisation 
de D est appelée paramétrisation normale positive de l'observateur D. On a montré 
qu'une telle paramétrisation existe toujours et on remarque facilement qu'elle est 
unique à translation en temps près. 

Vitesse Soit D, D deux observateurs et a, à des paramétrisations normales posi- 
tives respectives de D et D. Quitte à faire une translation en temps, on peut sup- 
poser que pour t fixé, a(t) et à(t) sont simultanés. Alors, à'{t) s'écrit de manière 
unique 

â'(t) = k + aa'{t) 

oh k e kerT et où a G R. Comme T(à'(t)) = T(a'(t)) = 1, on voit que a = 1. 

Définition. Le vecteur k est appelé vecteur vitesse de D par rapport à D et est 
noté lïf)/ D 

Remarques et propriétés : 

(1) La vitesse ainsi définie dépend de l'instant t. 

(2) Si D,D sont des observateurs galiléens alors le vecteur vitesse lï è/ d est 
constant en fonction du temps. Cette définition est bien conforme à l'idée 
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que l'on se fait de la vitesse : le quotient de la distance par le temps. 
Prenons en effet deux observateurs galiléens D et D. Prenons A,B G D et 
A,B G D tels que A et A sont simultanés ainsi que B et B. Naturellement, 
on voit que la norme du vecteur vitesse v ô/ d est égal à 

\\BB- AA\\ 

T~AB 

(i.e. distance / temps). 

(3) On a !Î Ô/D = -~& D/Ô . 

(4) Si D est un troisième observateur, on a 

Accélération : Reprenons les notations utilisées pour la définition de la vitesse. 
On définit l'accélération de D par rapport à D par ~ct p = d/d- Supposons 
que D est galiléen. Puisque la vitesse relative de deux observateurs galiléens est 
constante, l'accélération définie ci-dessus ne dépend pas de l'observateur ga- 
liléen D. 



2. En relativité restreinte 

On abandonne la mécanique classique pour la raison suivante : de manière expéri- 
mentale, on constate que la vitesse de la lumière est constante (en norme) par 
rapport à n'importe quel observateur. Supposons qu'un observateur D voie passer 
la lumière dans une certaine direction à la vitesse c ~ 300000 km/h et qu'un autre 
observateur D' ait une vitesse de (c — f ) km/h par rapport à D dans la même 
direction que la lumière. La propriété (4) du vecteur vitesse défini en mécanique 
classique implique que la vitesse de la lumière par rapport à D' sera de f km/h, 
ce qui contredit l'expérience. On doit donc abandonner le modèle de la mécanique 
classique. C'est ainsi qu'est née la relativité restreinte en 1905 grâce aux travaux 
d'Einstein. 

Modélisation En relativité restreinte, l'univers est modélisé par un espace affine 
M. de dimension 4 muni d'une forme quadratique T sur E := M. de signature 
(-,+,+,+). 

D'un point de vue physique, on prend un espace affine pour éviter qu'il y ait des 
points privilégiés. Malgré tout, dans la pratique, on se placera la plupart du temps 
dans Y espace de Minkowski (M 4 , 77) où 

v : = -dt 2 + (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 . 

Dans E, il j a trois types de vecteurs lï : 

- les vecteurs de type temps : T(v) < ; 

- les vecteurs de type lumière : TÇv) = ; 

- les vecteurs de type espace : T(v) > 0. 
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On peut comme en mécanique classique choisir une orientation de temps. En effet, 
l'ensemble E des vecteurs de type temps a deux composantes connexes. Il faut re- 
marquer que cet ensemble est un cône dont le bord est l'ensemble des vecteurs de 
type lumière. On choisit l'une des composantes connexes et on la note E + , cet en- 
semble représentant l'ensemble des vecteurs de type temps orientés positivement. 
Une autre manière de voir les choses est de fixer un vecteur lï de type temps 
et de dire qu'un vecteur lï est orienté positivement si g(lï, l?o) > 0, où g est la 
forme bilinéaire associée à T. 

De la même manière, on définit 

- un observateur : courbe de genre temps (i.e. dont tout vecteur tangent est de 
type temps) 

- un observateur galiléen : droite de type temps. 

Soit D un observateur. En procédant comme en mécanique classique, on montre 
qu'il existe une paramétrisation c : / — > Ai de D, unique à translation en temps 
près que l'on appellera paramétrisation normale positive qui vérifie T(c'(t)) = — 1 
et c'{t) G E + pour tout t G I. On verra plus loin qu'il y a d'autres paramétrisations 
normales naturelles. 

Soit D un observateur paramétré par c : / — > Ai. 

En mécanique classique, V espace vu par D ou univers observable pour D à l'instant 
t est l'ensemble des points simultanés à c(t) c'est-à-dire c(t) +ker(T). L'espace vu 
par D ne dépend pas de D mais seulement du point c{t). 

En relativité restreinte, on a une définition analogue : 

Définition, on appelle espace vu par D au point c(t) l'espace affine c(t) + [c'(t)]- 1 -. 
En particulier, cet espace dépend de l'observateur D et pas seulement de c(t). 
Physiquement, cela correspond à l'ensemble des points simultanés à l'observateur 
à un instant donné. 

Si A, B G Ai, cela n'a pas de sens de se demander si A et B sont simultanés. Par 
contre si A G D et si B G Ai, on peut se demander si B est simultané à A pour D. 
C'est le cas si B G c{t) + [v] 1 - où v est un vecteur tangent à D en A. Contrairement 
à ce qui se passe en mécanique classique, la simultanéité n'est pas symétrique (si 
A E D, A' E D' et si A' et A sont simultanés pour D, ils ne le sont pas forcément 
pour D'). 

Pour avoir une bonne image en tête, le plus simple est d'imaginer M 2 muni de 
— dt 2 + dx 2 . Soit D un observateur galiléen. Si D est parallèle à l'axe des abscisses, 
l'espace vu par D est vertical (axe des ordonnées). Si l'espace ï5 (droite vectorielle 
associée à D) se rapproche de la position limite x = t alors [É] 1 - aussi ([S] 1 - est 
le symétrique de ~~Ô par rapport à x = t). 

Ce modèle est assez pratique pour visualiser correctement ce qui se passe, mais pour 
coller plus à la réalité physique, il faudrait plutôt penser à IR 2 muni de — dt 2 + e 2 dx 2 
avec e petit. Ainsi, lorsque e est suffisamment petit, l'orthogonal de toute droite 
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t hi variable d'espace 



Observateur D' 



Observateur D 



Figure 1. Simultanéité en relativité restreinte 



de type temps est "presque" verticale. En effet, l'orthogonal d'une droite dirigée 
par (a, b) est dirigé par (e,a/b) et on se rapproche du modèle M 2 muni de — dx 2 
qui permet de visualiser la mécanique classique (considérer dt 2 ou — dt 2 ne change 
rien à la géométrie). 



Définition. Soit D un observateur (pas forcément galiléen) paramétré par c : / — > 
M. 

- Soient A = c(t±), B = c(t 2 ) G D. Le temps propre pour l'observateur D entre A 
et B est donné par 



t ab = [ 2 y/-T{d{t))dt. 

Ju 



Physiquement, il s'agit du temps que mesure l'observateur D entre A et B. 
- Soient A,B G Ai simultanés pour D (i.e. il existe t tel que A,B G c(t) + [c'^)] -1 ). 

On définit la distance de A à B (pour D) par d(A, B) = \j T(AÈ). 

Remarque II. 8. 

(1) Le temps propre ne dépend pas de la paramétrisation choisie. 

(2) La définition est la même qu'en mécanique classique (on remplace juste 
T par — T) : en mécanique classique, lorsque l'on écrit 

rti 

tab 



^T{d{t))dt 

(T est ici de signature (+, 0, 0, 0)) on voit que l'on obtient r AB = \J T(AÈ). 

En effet, on peut écrire de manière unique Ac{t) = k (t) + a(t)ÂÈ où 

k (t) G ker(T) et a(t) G K. Alors c'(t) = k'(t) + a'{t)ÂÈ et a'(t) est 
de signe constant (sinon c n'est pas de genre temps). Supposons par 



exemple a'(t) > 0. Alors, y/T(d(t)) = a'(t)^ T(ÂÈ). Ainsi, t ab = 

(a(t 2 ) — a(t\))A~È. En revenant à la définition de a, on voit que a(t\) = 
et a(t 2 ) = 1 (car c(ti) = A et c(t 2 ) = B), d'où le résultat. 

(3) Si l'on se donne A, B G Ai, cela n'a pas de sens comme en mécanique clas- 
sique de parler de temps qui sépare A et B. Cela dépend de la trajectoire 
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choisie. Imaginons A,BeM tels que est de type temps. Prenons 
la trajectoire directe (i.e. la droite (AB)). On regarde le temps propre 

entre A et B et l'on trouve tab = J-T(ÂÊ). Maintenant, imaginons 
une trajectoire entre A et B de type lumière, (ou du moins très proche 
d'une trajectoire de type lumière) et calculons le temps propre entre A et 

B. On paramétrise par c : I — y R. On voit que T(c'(t)) = si bien que 
t ab — 0. Évidemment, physiquement, aucun observateur ne peut suivre 
une courbe de type lumière mais si la trajectoire s'en rapproche, le temps 
propre tab sera très petit. En particulier, on remarque que si deux ob- 
servateurs D et D' ont une trajectoire qui passent par A et B 
et si D voyage à une vitesse proche de celle de la lumière, i.e. 
avec une trajectoire dont la tangente se rapproche de la position 
limite "lumière", D aura un temps propre beaucoup plus petit 
que D' entre A et B. Cette propriété, contraire à l'intuition, est connue 
sous le nom de paradoxe de langevin. On la présente habituellement en 
disant que deux jumeaux sont nés sur Terre. L'un part en voyage à une 
vitesse proche de celle de la lumière. Quand il revient sur Terre, il est 
beaucoup plus jeune que son frère. 

X est !a variable d'espace 



Observateur D 



I la viiriiibk' de temps 



Pour aller du point A au point li. l'observateur D a mis beat 
moins de temps ( iir il est pruehe île lii vitesse de- la lumière o 
fait que T(3) « T'(i?) (r est la forme quadratique 



Figure 2. Paradoxe des jumeaux de Langevin 



(4) Soit lï un vecteur de type temps. Alors l'hyperplan vectoriel pï^] -1- est de 
type espace (i.e. TWu est de signature (+,+,+)). En effet, la signature 
de T est obtenue en ajoutant un — (car v de type temps) à celle de 
TWi±. En particulier, dans la définition de d(A,B), tÇÂÈ) > 0. 

(5) Dans un sens, tout est beaucoup plus naturel qu'en mécanique classique 
car il n'y a pas besoin de se donner un produit scalaire supplémentaire. 
Toute l'information est contenue dans T. 

Paramétrisation normale positive pour un observateur galiléen D. Soit 
D un observateur galiléen de vecteur directeur in unitaire {T{id) = — 1) orienté 
positivement) paramétré par c : / — > A4 tel que pour tout t, c'{t) = %r>- Pour D, 
l'unité de temps est io- Maintenant considérons un autre observateur D paramétré 
par c : / — > M.. Il est naturel de décomposer pour tout t c'(t) = k + aio où a G R 
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et k G [îd]" 1 - En mécanique classique, si T(c'(t)) = 1 alors a — 1. En relativité 
restreinte, T(c'(t)) = — 1 n'implique pas a = 1. En particulier, il est naturel de 
considérer une paramétrisation orientée positivement pour laquelle a = 1 pour 
tout t, c'est-à-dire qui respecte l'unité de temps pour D (voir la Remarque III. 91 
ainsi que le point 1 de la Remarque III. 10p . Une telle paramétrisation existe, est 
unique à translation en temps près (même argument que pour l'existence des autres 
paramétrisations normales) et sera appelée paramétrisation normale positive pour 
l'observateur D. 

Remarque II. 9. L'une des propriétés d'une telle paramétrisation est la suivante : 
si t G /, t G I sont tels que c{t) et c(t) sont simultanés pour D, alors pour tout a, 
c(t + a) et c(t + a) sont simultanés pour D. En effet, quitte à faire une translation 
en temps, on peut supposer t — t et alors 

/t+a 
(c'(s) - c'(s))ds G [io] 1 - 

car les deux termes du membres de droites sont dans [^d] -1 . On voit avec cet argu- 
ment pourquoi il est nécessaire de définir ce type de paramétrisation relativement 
à un observateur galiléen. Par contre, si c et c sont des paramétrisations normales 
positives de deux observateurs D et D et si c{t) et c{t) sont simultanés pour D, 
en général c(t + a) et c(t + a) ne sont pas simultanés pour D. 

Vitesse : Soit D, D deux observateurs paramétrés respectivement par c : / — > Ai 
et c : / — > Ai. On suppose que c est une paramétrisation normale positive. Fixons 
un point A E D que l'on écrit A = c(t). Quitte à faire une translation en temps, 
on peut supposer que c(t) est simultané à c(t) pour D. Le vecteur c'{t) s'écrit de 
manière unique 



c'(t) = ~t + ac'(t) 



où k G [c'(t)]" 1 " et où a G 



Définition. Le vecteur vitesse de D par rapport à D est 



-i t 



Remarque 11.10. 



(1) Si c est une paramétrisation normale pour D, a = 1 et donc lï î>/ D = k . 

(2) Parler de vitesse sans préciser l'observateur par rapport auquel on se place 
n'a pas de sens sauf pour la vitesse de la lumière qui est constante par 
rapport à n'importe quel observateur (voir Proposition 111.121 ci-dessous). 

(3) La vitesse relative de deux observateurs galiléens est constante. Avec les 
notations ci-dessus, Vf)/ D correspond exactement à la vitesse relative de 
deux observateurs galiléens dirigés par c'(t) et c'{t). 

(4) Cette définition correspond bien à l'intuition. Si D et D' sont deux ob- 
servateurs galiléens qui se croisent en A et si B G D et B' G D' sont 
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simultanés pour D alors 



, BB' 

D/D - — 

tab 



(=distance parcourue dans la direction de BB' divisée par le temps). 
En effet, soit v , v' des vecteurs directeurs de D et D' normaux orientés 
positivement. Ecrivons B = A+av et B' = A +a'lï'. Comme B et B' sont 
simultanés pour D, on a BB' G [v]^. On écrit lï' = k + slï où k G [f] -1 

et où s G M. On a alors a'"^' — alï G [f] -1 i.e. a' k + (a' s — a)lï G [f] -1 et 
donc a' s — a = ou encore a' = a/s. Cela donne que 



BB' = a'k. (11.11) 



Par ailleurs, on a par définition 



k _ a' k _ BB' 

Comme a = \J —TÇÂÈ) = t A b on a le résultat cherché. 
Avec cette modélisation de l'espace, on a 

PROPOSITION 11.12. La vitesse de la lumière par rapport à n'importe quel ob- 
servateur est constante. 

Dans cette proposition, par "vitesse de la lumière", il faut bien évidemment com- 
prendre " norme du vecteur vitesse de la lumière" . 

Remarque 11.13. Avec la normalisation choisie, on trouve que la vitesse de la 
lumière est 1. Pour changer cette valeur, il suffit de normaliser les vecteurs de type 
temps à une autre constante que 1. 

DÉMONSTRATION. Soit D un observateur paramétré par c : / — > A4, pa- 
ramétrisation normale positive et L un rayon de lumière i.e. une droite de type 
lumière. Soit / un vecteur directeur de L (qu'on ne peut pas normaliser puisque 

T( l ) — 0) on peut paramétrer L par c(t) = M + t l . Soient A = c(t) un point 
de D et B = c(t) un point de L simultané à c(t) pour D. On écrit 

c'(t) = ~t = lc + ac'(t) 

où a G K et où k G [c'^)]^. Quitte à remplacer l par — l on peut supposer que 
a > 0. Par définition, on a 

-i t 

Vl/d = — • 
a 

Remarquons que 

= g(î, ?) = g(t, t) + a 2 g(c'(t), c'(t)). 
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Comme g(c'(t),c'(t)) = — 1 et comme a > 0, on a a = \/T( k ), ce qui implique 
que 

t 

vl/d = — • 
a 

Ainsi 



||^l/d|| = y TÇ1Ï £,/£)) 
ce qui démontre le résultat. 



□ 



3. En relativité générale 

On abandonne la relativité restreinte principalement parce que, comme on le verra 
dans le prochain chapitre, elle n'est pas adaptée à la description du comporte- 
ment de la matière. Un autre problème est qu'en relativité restreinte, comme en 
mécanique classique, les observateurs galiléens sont des observateurs privilégiés, ce 
qui physiquement n'est pas satisfaisant. Einstein a ainsi introduit la théorie de la 
relativité générale, dont il a publié les bases en 1915. 

Modélisation En relativité générale, l'univers est modélisé par une variété 
Ai munie d'une métrique lorentzienne g, c'est-à-dire une métrique de signature 
(—, +, +, +) sur chaque espace tangent T x Ai. 

On pourra regarder l'Appendice |Â] pour avoir quelques précisions sur la géométrie 
lorentzienne. 

Remarque 11.14. On simplifiera en prenant des variétés C°° mais Hawking a 
étudié les conséquences de considérer des variétés de régularité plus faible. 

Soit lï G TM. On dit que 

- v est de genre temps si gÇv , v) < ; 

- v est de genre lumière si gÇv , v) = ; 

- v est de genre espace si gÇv , v) > 0. 

Une courbe est de genre temps (resp. lumière, resp. espace) si en tout point ses 
vecteurs tangents sont de type temps (resp. lumière, resp. espace). 



Dans chaque espace tangent T x Ai, l'ensemble E x := { v G T x Ai\g x (v,v) < 0} a 
deux composantes connexes. 

Définition. Une orientation en temps continue de (Ai, g) est une orientation en 
temps de chaque espace tangent (i.e. le choix d'une composante connexe de 
E x ) telle que pour tout x G Ai, il existe un voisinage V x de x et un champ de 
vecteur X G Y(TV X ) sur V x tel que pour tout y G V x , X(y) est dans E+. 

Si un tel choix existe, on dit que (Ai, g) est orientable en temps. Dans la suite, 
on suppose (Ai, g) est orientée en temps, c'est-à-dire que (Ai, g) est orientable en 
temps et qu'une orientation en temps continue a été fixée. 



Définition. 
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- On appelle observateur une courbe de genre temps. 

- On appelle observateur en un point x G Ai la donnée d'un vecteur lï G T X M de 
genre temps, unitaire (i.e. g(v,lï) = 1) et orienté positivement (i.e. lï G 

- Soit D un observateur (ou un observateur en un point). L'espace global vu par 
D en x G D est la partie de Ai qui est ^-orthogonale, c'est-à-dire la partie £ x 
de Ai formée de la réunion de toutes les géodésiques issues de x et orthogonale 
à D en x. 

- Soit D un observateur paramétré par c : / — > Ai. Le temps propre entre A = 
c(a) G Ai et B = c(b) G M est donné par 

r-b 

tab= / y/-g(d(t),d(t))dt. 

J a 

Remarque 11.15. 

(1) De même qu'en relativité restreinte et en mécanique classique, si D est un 
observateur, il existe une paramétrisation normale positive de D, unique 
à translation en temps près, i.e. une paramétrisation c : / — > Ai telle que 
pour tout t, g{c'{t),c'{t) = 1 et d(t) G E+ t) . 

(2) En relativité restreinte, on n'avait pas besoin de la notion d'observateur 
en un point, bien que beaucoup de notions auraient pu se restreindre à 
cette définition (par exemple la vitesse ne dépendait que de la position et 
du vecteur tangent). 

(3) L'espace global vu par un observateur en x est une sous-variété de type 
espace de dimension 3 au voisinage de x (même argument qu'en relativité 
restreinte). 

Avec ces définitions, parler de vitesse n'a pas vraiment de sens. En effet, soit D 
un observateur en un point x G Ai dirigé par lï G T x Ai unitaire. On a besoin 
de décomposer un vecteur d'un autre espace tangent T y Ai en une composante sur 
lï et une composante sur [lï] ± - Il y a plusieurs manières de la faire, mais aucune 
n'est canonique. 



CHAPITRE III 



De la matière dans l'espace-temps 

Ce chapitre a pour but d'arriver jusqu'à l'axiomatique de la relativité générale pour 
décrire le comportement de la matière. Avant d'en arriver à ce stade, il faut com- 
prendre quels sont les problèmes posés par la mécanique classique et la relativité 
restreinte. Quelle que soit la manière dont on construit la théorie, il faut garder à 
l'esprit qu'un "observateur humain" doit percevoir les mouvements prédits par les 
lois de Newton. Ces règles ne peuvent en aucun cas être remises en cause à vitesse 
faible (par rapport à celle de la lumière). La principale différence entre la relativité 
générale et la mécanique classique doit surtout se faire sentir soit à grande échelle, 
soit lorsque des vitesses importantes sont en jeu (par exemple, un GPS qui analyse 
très précisément la position d'un utilisateur à partir d'ondes tient compte des effets 
relativistes). C'est pourquoi dans ce chapitre, nous commençons par rappeler les 
lois utilisées pour décrire le comportement de la matière en mécanique classique 
et en relativité restreinte, ce qui nous amènera naturellement à l'axiomatique de 
la relativité générale. 

1. Particules et fluides 

En mécanique classique, relativité restreinte et relativité générale, la matière est 
supposée se composer de particules qui se définissent de la manière suivante. 

Définition. En mécanique classique, relativité restreinte et relativité générale, 
une particule est un couple (C, m) où C est une courbe de genre temps et m est un 
nombre positif ou nul, la masse de p. 

Autrement dit, une particule est un observateur muni d'une masse. Lorsqu'on 
prend en compte les phénomènes électromagnétiques, on lui attribue également 
une charge e. 

Malheureusement, si on s'intéresse au mouvement de chaque particule, les équations 
qui apparaissent même en mécanique classique sont quasiment irrésolubles. Cela 
conduit à considérer la matière comme un fluide. 

Définition. 

(1) Une congruence de courbes (terminologie de S. Hawking) sur un domaine 
Q de M est une famille de courbes de type temps qui ne se coupent pas. 
Plus précisément, il s'agit d'une famille de courbes (Cj)j e x de type temps 
telle que tout x G fl admet un voisinage ouvert w x et un difféomorphisme 
(avec régularité suffisante pour que tout soit bien défini) <p x : w x — >■ / x B 
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(où / est un intervalle ouvert de M et où B est une boule ouverte de M 3 ) tel 
que pour tout j G X, il existe un unique y G B avec <p x (Cj Dw x ) = I x {y}. 

(2) Un fluide dans Ai est un couple (congruence de courbes, p) où p : Ai — )■ 
M. + est une fonction appelée densité de masse du fluide. Ce couple devra 
vérifier une propriété supplémentaire que l'on définira plus tard (voir la 
"propriété requise" ci-dessous). 

Physiquement, les courbes représentent les trajectoires de chaque point du fluide. 
Avec ce point de vue, on ne voit plus les particules une à une. Prenons un obser- 
vateur D attaché au fluide (i.e. l'une des courbes de la congruence). La fonction 
densité de masse, physiquement, se définit comme suit : au point x, considérons 
l'observateur D x fixé au fluide (i.e. la courbe qui passe par x). Le densité de masse 
est la limite du quotient de la masse mesurée par D x (i.e. la somme des masses 
des particules) contenue dans un voisinage v x de £ x (espace vu par D en x) par le 
volume pour la métrique riemannienne induite de v x lorsque v x se réduit autour 
de x. 

Remarque III. 16. On pourrait penser que la fonction densité de masse décrit 
complètement le fluide à elle seule puisqu'elle indique la quantité de matière 
présente à tout instant et à tout endroit. En fait, elle n'est pas suffisante : par 
exemple, sans la donnée de la congruence de courbes, on n'a aucun moyen de 
détecter la rotation d'une particule sphérique. 

Définition. Considérons un fluide F dans Ai. Le champ de vecteurs unitaire 
associé à F est le champ de vecteurs u formé des vecteurs tangents aux courbes 
du fluides, normaux (TÇvt) = 1 en mécanique classique, T(u) = g(~ït,lî) = 
— 1 en relativité restreinte et g(~ït,lî) = —1 en relativité générale) et orientés 
positivement. 

Définition. Considérons une hypersurface S de type espace et un fluide F de 
densité de masse p. On appelle masse au repos de F sur S le flux du champ u à 
travers S (voir l'Appendice 12} . En relativité restreinte et relativité générale, elle 
est définie par l'intégrale 

pgÇîî,lt) 

où H est le champ de vecteurs unitaire, où it est le champ de vecteur ^-orthogonal 
à S, unitaire (g(lî,~rt) = —1) et orienté positivement. 

Donnons quelques explications sur la "masse au repos". Supposons que S soit g- 
orthogonale à u , c'est-à -dire, d'un point de vue physique, au "mouvement" du 
fluide. Alors, g(~ït,Tt) = —1 (car u = it) et la masse au repos est la masse de 
fluide que contient S mesurée par un observateur D fixé au fluide. 

Propriété requise (en mécanique classique, relativité restreinte et rela- 
tivité générale) : 

Soit F un fluide, p et~ït respectivement la densité de masse et le champ de vecteurs 
unitaire associés à F. On impose que 

div(p^) = 0. (III. 17) 
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Cette condition traduit le fait qu'il n'y a pas de perte de matière entre deux 
instants donnés. Essayons de comprendre pourquoi. On se place dans le cadre de 
la relativité générale ou restreinte. Reprenons la définition de la congruence de 
courbes : pour x G Ai il existe un voisinage w x difféomorphe via (p x à / x B. Pour 
simplifier, supposons que / =]0, 1[ et identifions w x à ]0, l[xB (on confond w x et 
son image). Le bord de w x est formé de trois parties : So : = {0} x B , S\ := {1} x B 
et £2 :=]0, lfxS 1 . On se place dans la situation la plus claire physiquement : So et 
Si sont g-orthogonales au fluide - c'est-à-dire que les points de So et Si sont tous 
simultanés pour un observateur fixé au fluide- alors que S 2 est tangente au fluide 
(voir Figure [TJ Notons n j le vecteur normal à Sj 7^ 2 sinon Sj n'est pas de 
genre espace). Notons aussi ds g l'élément de volume induit par g sur Sj. 

Si 

Courbes du fluide ' 

. / s, 

\ ^ H 

f \ s- \ 



Figure 1. Conservation de la masse 
Avec le théorème de Stokes (voir l'Appendice |AJ 

3 



= / div(p lï )dv g = / pg(~ït,Ttj)ds 

J w x i=1 J Sj 



où rij est le vecteur g-orthogonal à Sj, unitaire et sortant. Autrement dit, no 
-¥ et ni = ni. De plus, il est clair que 

/ pgÇit, Tt 2 )ds g = 0. 

On obtient ainsi 



= / pg(~ït,lti)dsg - / pgÇït,j£ )ds g 
J s± J Sq 

ce qui montre que la masse au repos du fluide sur S est la même que sur Si. 



À l'échelle de l'univers, les fluides sont composés d'étoiles, de galaxies qui jouent 
le rôle de particules. Ces particules s'entrochoquent rarement et les forces qui 
s'exercent entre elles ne sont pas de nature électromagnétique (en fait, on verra 
qu'en relativité générale les particules n'interagissent pas entre elles). Cela conduit 
à introduire la définition suivante : 

Définition. Un fluide parfait sans pression est un fluide dans lequel les particules 
sont indépendantes les unes des autres et dans lequel il n'y a pas d'autre énergie 
que celle des particules (pas de chocs, c'est-à-dire pas de viscosité, pas de rotation) 
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Cette définition est parfaitement adaptée au modèle de la relativité générale, où 
comme on le verra plus tard, les particules sont supposées ne pas avoir d'in- 
teractions entre elles. Un fluide parfait inclut normalement la pression (qui est 
une énergie supplémentaire) mais lorsque les particules du fluide sont constituées 
d'étoiles, de planètes et de galaxie, la pression est supposée nulle, sauf à l'intérieur 
des particules. Ce modèle est aussi utilisé dans d'autres cadres, par exemple dans 
le cas d'un fluide de très faible viscosité (par exemple en aérodynamique). 



2. En mécanique classique 



En mécanique classique, les principes utilisés sont ceux de Newton, qui traduisent 
V attraction universelle (deux objets quelconques s'attirent mutuellement), idée qui 
sera complètement abandonnée en relativité générale. Il y a deux points de vue 
différents pour modéliser l'attraction universelle. Soit on utilise les lois de Newton, 
soit on utilise la notion de Lagrangien. Bien évidemment, quel que soit le point de 
vue choisi, on retrouve les mêmes résultats. 



2.1. Point de vue du potentiel pour des particules. Ce paragraphe a 
pour but de formuler la loi de Newton qui traduit l'attraction universelle. 



Soit p = (C, m) une particule. 

Définition. Le potentiel créé par p est la fonction définie sur Ai par 

km 



f P (M) 



d(p,M) 



où k est une constante universelle appelée constante de gravitation et où d(M, p) 
est la distance introduite dans le paragraphe [T] du chapitre HO 



Le comportement de la matière est alors régi par la 



Loi de Newton Soient p\ = (Ci,rai), • • • ,Pn = {C n ,m n ) des particules. On 
suppose que les courbes Ci ne se coupent pas. Alors pour tout i G {1, • • • ,n} 
l'accélération de la particule pi en M G Ci est 

où Va, est le gradient calculé dans la direction de ker(T). 



L'accélération est calculée relativement à un observateur galiléen mais rappe- 
lons qu'elle ne dépend pas de l'observateur galiléen choisi. Ce système différentiel 
d'ordre 2 est presque impossible à résoudre dès qu'il y a 3 particules ou plus en 
jeu {problème des 3 corps). 
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2.2. Point de vue du potentiel pour un fluide parfait sans pression. 

Ce paragraphe sert à faire deviner quelles seront les bons axiomes à poser en rela- 
tivité générale pour qu'à vitesse faible (par rapport à celle de la lumière), on puisse 
retrouver des lois proches de celles de Newton. 



On rappelle que le potentiel créé par des particules p\ = (Ci, mi), • ■ ■ ,pi = (Ci, mi) 
est 



f(M) = -kJ2 



m 

mi 



^d(M,d) 

où d(M, Ci) est la distance de M à l'unique point de Ci qui est simultané à M. Par 
extension, si F est un fluide parfait sans pression de densité de masse p, on définit 
le potentiel créé par F en posant 

où rappelons-le g est le produit scalaire dont nous avons muni ker(T) et où l'on a 
choisi l'unité de masse pour que k = 1. Soit maintenant D un observateur galiléen 
dirigé par i D unitaire, orienté positivement. On rappelle que dès lors qu'on choisit 
une origine A G D (ce qui correspond à choisir un instant t = pour D) D 
"voit" Ai comme M x ker(T) via l'isomophisme (Çd décrit dans le paragraphe [T] 
du chapitre |TTJ L'hyperplan {t} x ker(T) correspond à l'espace observable par D à 
l'instant t. Via cet isomorphisme, / se réécrit 

/(*,*) = -/ jr^\dv g (y) 

Aer(T) d(x, y) 

pour tout (t,x) 6lx ker(T). 

Remarque III. 18. Avec les mêmes notations, si Q C ker(T), l'intégrale 

p(t,y)dv g (y) 



n 

représente la masse du fluide qui se trouve dans fl (bien sûr, ce fl dépend de D à 
l'instant t). 

Maintenant, il faut se souvenir que la fonction de Green du laplacien sur (ker(t), g) 
est 

(on travaillera toujours avec le laplacien avec la convention de signe suivante : il 
est égal à — Y^i ~§^s lorsque la carte (xi, ■ ■ ■ , x n ) est une isométrie sur un ouvert 
de W 1 muni de sa métrique standard) et ainsi 



f(t,x) = -4n G(x,y)p(t,y)dv g (y). 

Jker(T) 



Autrement dit, on a 
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A,/ 



(111.19) 



La loi de Newton traduite sur les courbes du fluide est alors donnée par 

~ct(t,x) = -V x f{t,x) 



(111.20) 



où a (t, x) est l'accélération au point x et au temps t de la courbe du fluide passant 
par (t,x). Maintenant, on rappelle que 



traduit la conservation de masse. Lorsqu'on considérait la matière particule par 
particule, cette relation était juste remplacée par le fait qu'il y avait à tout instant 
le même nombre de particules et que leur masse était constante. 

Les relations (lIII.19p . (lIII.20p et (lIII.2ip sont les relations qui régissent le 
mouvement d'un fluide parfait sans pression en mécanique classique. Ce 
sont elles que l'on va essayer de retrouver à vitesse faible en relativité 
générale. 

2.3. Point de vue du lagrangien. Ce paragraphe donne une formulation 
équivalente à la loi de Newton qui permet d'introduire naturellement les notions 
d'énergie et d'impulsion qui seront à la base de la théorie en relativité générale. 
Pour finir nous regarderons l'exemple d'une particule dans le vide. La lecture de 
ce paragraphe n'est pas indispensable pour comprendre d'où vient l'équation d'Ein- 
stein. 

Le point de vue du lagrangien consiste à voir les trajectoires des particules comme 
des chemins minimisant une fonctionnelle appelée fonctionnelle d'action (en quelque 
sorte des géodésiques sauf que cette fonctionnelle dépend du système physique). On 
travaille donc particule par particule. Physiquement, la fonctionnelle d'action cal- 
cule pour une trajectoire donnée l'énergie cinétique de la trajectoire moins l'énergie 
potentielle créée par les autres particules. En effet, les particules vont avoir ten- 
dance à suivre les trajectoires qui leur font dépenser le moins d'énergie (énergie 
cinétique) et qui va utiliser au maximum l'énergie potentielle des autres particules. 
En fait, on va oublier cette interprétation physique en relativité restreinte. 

Définition. 

(1) Un lagrangien d'une particule p = (C,m) dans un système physique (i.e. 
dans un ensemble de particules contenant p) est une application C 1 L : 
Ai x E — > R qui vérifie plusieurs axiomes que nous préciserons plus tard 
et qui permettront de modéliser les trajectoires des particules. 

(2) Soit L un lagrangien de p et A, B G C. Dans la suite on considérera 
toujours que B est ultérieur à A. Notons tab le temps entre A et B. Soit 
C une autre courbe de genre temps passant par A et B paramétrée par 
: [0,tab] — > -M-, normale orientée positivement et telle que (3(0) = A 



ou 
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et 0(tab) = B (on dira que (3 est admissible) . On définit la fonctionnelle 
d'action associée à L entre A et B par 

S AB {C) (ou Sab{P)) = / L(J3(t),P'(t))dt. 

Jo 

Comme expliqué plus haut, on veut que 
Axiome 1 

Sab(p) := S AB (C) < S AB (C) 
pour toute courbe C de genre temps passant par A et B ou de manière équivalente 

Sab(p) < S AB {(5) 
pour tout paramétrisation (3 admissible. 

Le lagrangien d'une particule p vérifiant l'axiome 1 n'est pas unique. Il est défini à 
une différentielle totale près. Rappelons qu'une différentielle totale est une fonction 
F : A4 x E M de la forme F(x, ~t) = df x (lï) où / : A4 -> R. En effet, soit F 
une telle fonction. Notons V = L + F. Alors, puisque 

"TAB 

F(/3(t),P'(t))dt = f(B)-f(A) 



o 

pour toute paramétrisation (3 admissible, les fonctionnelles d'action associées à L 
et L' ne différent que de la constante f(B) — f(A) et l'axiome 1 est vrai pour L si 
et seulement si il est vrai pour L'. Inversement, on a : 

PROPOSITION III. 22. Si les fonctionnelles d'action de deux lagrangiens L et V 
différent d'une constante pour tous A, B , alors L et L' diffèrent d'une différentielle 
totale. 

Démonstration. On définit la forme différentielle w par w(x)( v ) = L(x, ~^) — 
L'(c, it). Par hypothèse, l'intégrale de w(x) le long d'un chemin ne dépend que des 
extrémités de c. On fixe q G Ai et on définit pour x G A4 la fonction / (x) = j c w 
où c est un chemin quelconque joignant q h x. Fixons x G A4 et prenons une base 
(ei, e 2 , e 3 , e 4 ). La forme w s'écrit w = X^=i a id>Xi où les dxi sont les fonctions co- 
ordonnées dans cette base. Pour t petit, remarquons que f(x + tef) = f w + J w 
où Ci(s) = x + sti pour s G [0, t]. Comme le premier terme ne dépend pas de t, 

d d f* , d f 1 

— f(x + tei) = — / w(c(s))(c'(s))ds = — / ai(c(s))ds = cn(x). 
att=o att=oJo att=oJo 

Cela montre que w = df et que L et L' diffèrent d'une différentielle totale. 

□ 



Soit D A un observateur galiléen muni d'une origine A (voir paragraphe [T] du cha- 
pitre [TT])- On a vu que D A déterminait de manière naturelle un isomorphisme entre 
A4 et M x ker(T) en écrivant, pour tout point M G A4 

AM = k +ai D 
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où a e R, k G ker(T) et où io est le vecteur unitaire orienté positivement qui 
dirige D. 

Définition. Soient L un lagrangien d'une particule p dans un système physique. 
Le lagrangien de p vu par D a et associé à L est donné par 

R x ker(T) x ker(T) -»■ R 

(t,x,~&) i— >■ L{M,lî + i D ) 



J D A 



où M est tel que = + tijj. 

Soit /3 : [O, tab] — ► -M- une paramétrisation admissible entre A et un autre point 
B de D. On peut lui associer 







[0,r AB ] -> Mxker(T) 
i h-)- (a(t), fc (t)) 



où comme dans la définition ci-dessus, Af3(t) = k + a(t)i D . Remarquons que 
comme T((3'(t)) = 1, on a T{a'{t)ir>) = 1 et a'(t) = 1. Comme de plus a(0) = 

(puisque /3(0) = A), on a a(t) = t. Ainsi (3(t) — (t, k). De cette manière, k '(t) = 

~Ù p/D (voir le point 1 de la Remarque III. 10p . On a aussi k'(t) = (3'{t) —io- On en 
déduit que 

L DA (t,lt(t),t'(t)) = L(P(t),P'(t)). 
Cela justifie cette définition d'autant que si on pose, 

Sab(J3)= / L DA (t, k(t), k'(t))dt 
Jo 

la courbe c associée à la courbe c paramétrant la courbe C de p minimise la fonc- 
tionnelle Sab parmi tous les (3. 



On a maintenant le résultat suivant (voir Avez, calcul différentiel) 

THÉORÈME III. 23. Soit F : K x ker(T) x ker(T) ->■ R une fonction C 2 . Suppo- 
sons qu'une courbe k : [ti,^] - > ker(T) minimise 

S (h) = f 2 F{t,k{t),k'{t))dt 
Jti 

parmi toutes les courbes normales orientées positivement, alors on a 

d x F{t,k{t),k'{t)) — d/dt (d v F( t>k (t) tk r(ty) (III. 24) 

où d x et d v représentent respectivement les différentielles partielles relativement 
aux deuxième et troisième variables. 

Ce théorème calcule l'équation d'Euler d'un minimiseur de la fonctionnelle d'action 
et fournit ainsi une équation différentielle dont les solutions donnent les trajectoires 
des particules. 



On va maintenant définir l'énergie et l'impulsion d'une particule dans un système 
physique vu par un observateur Da- Dans le premier chapitre, on explique briève- 
ment leur interprétation physique. Par ailleurs, les lois physiques données dans ce 
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même chapitre impliquent que ces grandeurs doivent être constantes avec le temps. 
D'un point de vue mathématique, ce sont des intégrales premières du système. On 
gardera ce point de vue mathématique ici. On verra aussi que leur définition impose 
des conditions très restrictives mais qui seront remplies pour le cas d'une particule 
dans le vide. On constatera au final que les résultats trouvés correspondent à ceux 
qui avaient été obtenus par des intuitions physiques au Chapitre Q] 

PROPOSITION III. 25. Avec les mêmes notations que ci-dessus, on suppose que 
Ld a ne dépend pas de la première variable. Soit c : [0, tab] ~~ ^ M l'unique 
courbe admissible qui paramètre la courbe C de la particule. Notons c : [0, tab] — > 
R x ker(T) ; c(t) = (t, k (t)) la courbe associée vue par l'observateur Da (voir 
ci-dessus). Alors le nombre 

£(t) = (d v L DA ) {t(t)tl{t)) (t'(t)) - L DA (t(t),t'(t)) 

est constant. On l'appelle /'énergie de la particule vue par Da- 

Insistons encore une fois sur le fait que cette proposition-définition n'a de sens que 
si Ld a ne dépend pas de la première variable. Notons aussi que si tel est le cas, 
il n'y a aucune raison que cette hypothèse soit vraie si on change d'observateur 
galiléen. Pour comprendre ce qui se passe physiquement, imaginons qu'un obser- 
vateur étudie une particule dans le vide. L'énergie de cette particule est la somme 
de son énergie au repos (qui est supposée nulle en mécanique classique) et de 
son énergie cinétique. Supposons que cet observateur soit en mouvement irrégulier 
par rapport à la particule. Imaginons par exemple qu'il soit soumis à des forces 
électromagnétiques et que la particule soit neutre électriquement. Alors, l'observa- 
teur va mesurer une énergie pour la particule qui est non constante dans le temps 
(elle va dépendre de la vitesse de la particule par rapport à l'observateur). Pour 
avoir une bonne définition d'énergie, il faut que l'observateur soit d'une certaine 
manière lié au système. 

Démonstration. On a en utilisant l'équation f]III.24j) 

^(t)=((4X D J (t(t)>W) (t'(t))) 

+ (d v L DA ) (t{tlt/m (t"(t)) - ± (L DA {t{tlt'{t))) . 

Or 

J t (W^W^'W)) = (^W(t( t ),f'( t ))(^'(*)) + ( d v L D A )(t {t) ^> ( t))(iï"(t))- 

D'où ^£{t) = 0, ce qui prouve la proposition. □ 



De même, on définit l'impulsion de la manière suivante : 
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PROPOSITION III. 26. On utilise les mêmes notations que dans la proposition 
précédente mais cette fois, on suppose que Ld a ne dépend pas des deux premières 
variables. Alors 

P = (d v L DA ) tl{t) e (ker(T))* ~ ker(T) 
est un vecteur constant que l'on appelle impulsion de la particule vue par Da 

Notons que dans l'énoncé ci-dessus, l'identification entre ker(T) et ker(T)* est 
donnée par le produit scalaire g (voir Paragraphe [T]). Encore une fois, les conditions 
extrêmement restrictives d'application de la proposition (dépendance de L Da de 
la troisième variable uniquement) seront vérifiées dans le cas d'une particule dans 
le vide. 

Remarque III. 27. Les définitions ci-dessus ne sont pas tout à fait rigoureuses. 
En effet, on a vu qu'un lagrangien était définie à une différentielle totale près. Si 
maintenant on remplace L par L+F où F est une différentielle totale, on va trouver 
une nouvelle énergie (et impulsion) qui seront les mêmes que celles trouvées avec 
L mais auxquelles on aura ajouté une constante. On verra que pour obtenir un 
modèle physique réaliste, il faudra que le lagrangien dépende de la masse de la 
particule. Il y aura alors un seul choix de constante possible pour que l'énergie et 
l'impulsion d'une particule de masse nulle soient nulles. 

Exemple d'une particule dans le vide. 

Comme expliqué ci-dessus, on pourra définir l'énergie et l'impulsion de la particule 
pour tout observateur galiléen. 

Dans ce cas précis, on considère une particule p = (C, m) et on va se donner 

Axiome 2 un lagrangien de p est invariant par les isométries de Ai i.e. pour toute 
isométrie ip : Ai — > Ai et pour tous A,BÇL M, il existe c G R tel que pour tout j3 
admissible, on ait Sab(<P ° /?) = Sab(/3)- 

Cet axiome traduit le fait que physiquement, il n'y a pas de direction privilégiée 
dans l'univers et qu'une particule que l'on "bouge" par une isométrie (position et 
vitesse) à un instant donné a une trajectoire qui est "bougée" de la même manière 
(i.e. par la même isométrie). Alors on montre 

THÉORÈME III. 28. En considérant les axiomes 1 et 2, il existe dans L (classe 
des lagrangiens définis à une différentielle totale près) un lagrangien Lq tel que 
pour tout v unitaire (T(v) = 1) et orienté positivement 

Lq(x, tf) — a\\ v — id\\ 2 

où in est le vecteur directeur unitaire orienté positivement d'un observateur ga- 
liléen fixé D . 

La démonstration de ce résultat n'est pas évidente du tout et sera omise ici. 
Remarque III. 29. 

(1) Dans l'énoncé ci-dessus, || • || est la norme associée à g (voir Paragraphe 
[T]). La définition a bien un sens car lï — %d G ker(T). 
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(2) La forme de L n'est donné que pour des vecteurs unitaires mais c'est à 
ces vecteurs que l'on applique L . 

(3) Le théorème dit "il existe D tel que ..." mais en fait, l'observateur D 
peut être choisi arbitrairement. En effet, si dans la définition de Lq, on 
remplace in par io> (D' étant un autre observateur galiléen), on obtient 
un lagrangien L' Q qui diffère de L par une différentielle totale. 

Dans ce théorème, on peut a priori prendre a = i.e. L = et les axiomes 1 et 2 
sont bien vérifiés mais toute trajectoire est alors minimisante ce qui ne correspond 
pas à la réalité physique. On va poser a = y. Fixons maintenant un observateur 
D. Pour simplifier, prenons celui que l'on a choisi dans le Théorème IIII.28I On a 
alors par définition L DA (t, x, v) = ~|| ~^ïl 2 qui ne dépend ni de t ni de x. L'énergie 
de la particule est donnée par (on conserve les notations utilisées lorsqu'on a défini 
l'énergie) 

— y Tri — y 
£ = (d v L DA )-j>, (t) ( k '(t)) - — 1| k ' 

et puisque (d v \\lf'\\ 2 )-^,^( k'(t)) = 2|| k'(t) || 2 , on trouve 



£ = -\\t' 



On remarque que k '(t) représente la vitesse de la particule par rapport à D. Ainsi, 
On trouve que E est égale à l'énergie cinétique de la particule au sens habituel 
(l/2mv 2 ). Comme on l'a expliqué plus haut, si on prend un autre lagrangien dans 
la même classe, on va trouver la même valeur de l'énergie plus une constante. On 
fixe cette constante à pour que l'énergie d'une particule de masse nulle soit nulle. 

De la même manière on trouve que l'impulsion est donnée par 

~f = m~t'{t). 

La trajectoire de la particule minimise la fonctionnelle d'action. La Proposition 
IIII.26I nous dit alors que le vecteur vitesse k '(t) de la particule par rapport à D 
doit être constant. Puisque D est arbitraire, on en déduit que la trajectoire de la 
particule est une droite. 

Lorsque le système physique considéré est composé de n particules, l'axiome 2 ne 
permet plus de conclure. En fait, on postulera directement la valeur du lagrangien 
d'une particule pour retrouver la loi de Newton : 

Axiome 2' Le lagrangien d'une particule pi = (Ci,mi) dans un système physique 
Pi = (Ci, rrii) (i G {1, • • ■ , n}) est donné par 

n 

vti\ 2 x ^ rrii 



Li(x,~&) = — - i D \\ 2 - k^ 



d(M,d) 



i=2 

où ijj est le vecteur unitaire positivement orienté d'un observateur galiléen fixé D, 
où k est la constante de gravitation et où d(M, Ci) est la distance de M au point 
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Mi de Ci qui est simultané à M. 

On remarque que ce lagrangien est en gros l'énergie cinétique de pi moins l'énergie 
potentielle des autres particules. 



3.1. Point de vue du lagrangien pour une particule dans le vide. Ce 

paragraphe a pour but de calculer l'énergie et l'impulsion d'une particule dans le 
vide en relativité restreinte. Ce sera un bon point de départ pour la théorie de 
la relativité générale du fait que, comme on le verra, on fera l'hypothèse que les 
particules sont indépendantes les unes des autres : chacune se comportera comme 
une particule dans le vide. La lecture de ce paragraphe n'est pas indispensable pour 
comprendre d'où vient l'équation d'Einstein. 

La loi de Newton pose de nombreux problèmes. Simplement par son énoncé, il y 
a interaction entre particules et de manière sous-jacente, il y a le problème de la 
simultanéité. Notamment (il faut essayer pour s'en convaincre), la loi de Newton 
amène à considérer des vitesses plus grandes que celle de la lumière : en effet, si un 
objet change de place, son potentiel newtonnien est trnasformé en conséquence et 
son influence sur l'univers tout entier est instantanément modifié. L'information a 
donc été transmise avec une vitesse infinie. Pour une seule particule dans le vide, 
le principe lagrangien ne s'appuie pas sur ces interactions entre particules et on 
peut regarder ce qui se passe en relativité restreinte. Dans ce cadre, on cherche un 
lagrangien qui vérifie les axiomes 1 et 2. L'exemple le plus simple est clairement 
de poser L = constante. On a vu que ce choix, en mécanique classique, même 
s'il ne contredisait pas les axiomes 1 et 2, n'avait aucune chance de modéliser la 
réalité physique puisque toute trajectoire minimiserait alors la fonctionnelle d'ac- 
tion. Comme on va le voir, la situation est différente en relativité restreinte. 

Soit donc p = (C, m) une particule dans le vide. On va poser L = —m, choix 
que l'on justifiera plus tard. Comme en mécanique classique, fixons A, B G C et 
prenons C une autre courbe de genre temps passant par A et B. La fonctionnelle 
d'action associée est 



où encore une fois les (3 admissibles sont les paramétrisations des courbes C définies 
sur [0, tab], normales de type temps orientées positivement et telles que (3(0) = A 
et (3(jab) = B. On rappelle que le temps propre d'un point c(a) à un point c(b) 
associé à une courbe c est défini par 



Soit maintenant un D un observateur galiléen dirigé par i D vecteur unitaire orienté 
positivement et j3 : [a, b] — > M. une paramétrisation d'une courbe C que l'on 
suppose normale pour l'observateur D (et qui n'est donc pas admissible). On veut 
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trouver l'expression du lagrangien de la particule relativement à l'observateur D. 
Pour cela, on écrit 

A(3(t) = ~î(t) + a(t)i D 

où k (t) G [in] , ot(t) G R et où l'on a choisi A comme origine. On verra par la 
suite que le résultat obtenu ne dépend pas du choix de l'origine. On obtient ainsi 
une courbe associée dans R x [iu] 1 ' $(t) := (a(t), k (t)). Comme en mécanique 
classique, puisque (3 est normale par rapport à l'observateur D, on a a'(t) = 1 

et k'(t) est la vitesse de (3 par rapport à D. On cherche le lagrangien L D de la 
particule vue par D, c'est-à-dire Ld : R x [in] 1 ' x [in] 1 ' — > R. Plus précisément, on 
cherche une fonction Ld telle que la fonctionnelle d'action associée à (que l'on 
reparamètre pour qu'elle soit admissible) soit égale à celle de (3 et ce, pour tout (3. 
Observons que comme T(Ïd) = — 1, on a : 

T((3'(t)) = T(t'(t)) -l=v 2 -l 
où v t := \/T(k '(t)) est la norme de la vitesse de la particule décrite par la courbe 



(3{t) par rapport à D. Ainsi 



rb 

Sab{C) = -m / a/1 - vldt = -mT AB 

J a 



où A = (3(a) et B = (3{B). Autrement dit, le lagrangien de la particule vue par D 
est 



L 



D 



x [in] 1 x [in] 1 -> R 

(t,x,lï) i — ^ -my/l-TÇtf) 



La fonctionnelle d'action associée redonne bien Sab{Ç'). 

Remarque III. 30. Si le vecteur vitesse v est petit par rapport à la vitesse de la 
lumière (qui rappelons, avec nos conventions, vaut 1), on voit que 

LdÇ^) ~ ~ m + -mv 2 

(v = T(v)). Comme —m + ^mv 2 a une fonctionnelle d'action dont les minimiseurs 
sont les mêmes que celle de \mv 2 1 qui était le lagrangien de p vue par D en 
mécanique classique, on remarque que pour des vitesses petites, les trajectoires de 
p vérifient les mêmes principes qu'en mécanique classique. C'est la première raison 
pour laquelle on a choisi de prendre L = —m. On en verra une deuxième après le 
calcul de l'énergie. 

Revenons maintenant au Théorème IIII.23l et aux Propositions lIH.25l et IIII.261 Leurs 
preuves ne font intervenir que la structure d'espace affine et pas la signature de 
la forme quadratique T. Autrement dit, ils restent valables en relativité restreinte. 
Comme Ld ne dépend que de la troisième variable, on peut définir l'énergie et 
l'impulsion. Fixons (3 = c où c : [a, b] — > Ai est une paramétrisation normale 
pour D de la courbe C associée à la particule p considérée. En gardant les mêmes 
notations que ci-dessus, on a pour l' énergie de p vue par D : 
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£{t) = (dL D ) t ( 



(k>(t))-L D (k'(t)). 



Puisque Ld(v) 



= —m 



a/1 — TÇvj, on a 



£{t) 



mT(k'(t)) 




\/l-T{t'{t)) 



m 




Remarque III. 31. Pour une particule au repos (c'est-à-dire vue par un obser- 
vateur pour lequel v = 0), on retrouve que l'énergie de la particule est E = me 2 
(voir Chapitre [T]) où c est la vitesse de la lumière (qui dans nos unités vaut 1). Cela 
fournit une deuxième raison de définir le lagrangien par L = —m pour une par- 
ticule de masse m. Une différence majeure avec la mécanique classique est qu'en 
relativité restreinte une particule au repos a une énergie non nulle. 

De même, on calcule que V impulsion de p vue par D est donnée par 



On retrouve la formule trouvée par intuition physique dans le Chapitre 1. Comme 
en mécanique classique, on déduit des Propositions IIII.25I et IIII.26I que la trajec- 
toires de p est une droite. 

Remarque III. 32. Puisque Sab(P) = — ttitab, une particule dans le vide a une 
courbe qui maximise tab- 

3.2. Énergie d'un fluide parfait sans pression. Ce paragraphe a pour 
but de définir l'énergie d'un fluide parfait sans pression en relativité restreinte. 
Cela permettra de donner en relativité générale une définition naturelle du ten- 
seur d' énergie-impulsion. La lecture de ce paragraphe n'est pas indispensable pour 
comprendre d'où vient l'équation d'Einstein. 

En relativité restreinte, Ai est un espace affine muni d'une forme bilinéaire symétri- 
que g (ou d'une forme quadratique T) de signature (—,+,+, +). C'est donc un 
cas particulier de variété lorentzienne dont la métrique est en tout point égale à g. 
Soit E un fluide parfait sans pression de densité de masse p. 

Définition. Soit D un observateur galiléen dirigé par ijj unitaire et orienté posi- 
tivement. 

(f) La densité d'énergie du fluide F par rapport à D est la fonction définie 



où v 2 x est la vitesse (en norme) du fluide en x pour l'observateur D (i.e. 
la vitesse de la courbe qui passe par x relativement à D). 



mk'{t) 



pour x G M par 
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(2) Soit S un voisinage d'un point x G M, S C x + [Îd] 1 ' (rappelons que 
x + [io} ± est l'ensemble des points simultanés à x pour D). L' énergie du 
fluide à travers S est l'intégrale 

£s = / e D ds„. 



Justifions cette définition. Supposons que sur S la vitesse du fluide par rapport à 
D est constante (en norme) égale à v . Alors par définition, 

£s = f P ds 9 - ( IIL33 ) 



-S' 



Par ailleurs, v = y g{~$ 'f/Di~^ f/d) et ~^f/d{x) = \ où l'on a écrit comme ci- 
dessus 

lï(x) = ~t + ai D . (111.34) 

Ici k G [îd]" 1 , a G K et ~ït est le champ de vecteurs unitaire associé à F. Mainte- 
nant, notons m la masse au repos du fluide sur S. On a par définition 

m = — pg(u,i D )ds g (III. 35) 



car i D est, puisque S C x + [ïd] , le champ de vecteurs (yf-orthogonal à S unitaire 
et positivement orienté. D'après l'équation ( 1111.34p . on a en utilisant le fait que 

k -L i D , 

g{!Ï,i D ) = -a. (111.36) 

Encore une fois avec (1III.34j) . 

-1 = gÇit, it) = g(k , k) - a 2 

et comme _^ _^ 

g{ k , k ) = a 2 g(lï F/D , ~¥f/d) = a 2 v 2 , 

cela donne 

-1 = a 2 (v 2 - 1). 

Puisque a > (car et zd sont positivement orientés), on obtient a = ^j=f ■ En 
injectant cette valeur dans flIII.36j) . on obtient que 

g(lt ) i D ) = —-L=. (HI-37) 

v 1 — v 

Avec (1III.35j) . cela donne 
Avec flIII.33j) . on obtient une énergie 



m = , l pds a . 



m 



vT 



V 



2 



On retrouve en particulier la valeur de l'énergie pour une particule dans le vide 
vue par l'observateur D (voir le paragraphe E]) • 
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4. En relativité générale 

Différence fondamentale avec la mécanique classique En mécanique clas- 
sique, on considérait que les particules s'attiraient entre elles. En relativité, le 
comportement de la matière est régi par deux axiomes. 

Axiome 1 : Les courbes des particules, paramétrées par leur temps propres (c'est- 
à-dire que la paramétrisation est normale positive), sont des géodésiques de type 
temps de (Ai, g). 

On considère que le tenseur g (et donc ses géodésiques) contient toutes les infor- 
mations sur la matière. 

Axiome 2 : Cet axiome donne précisément le lien entre le tenseur g et la matière. 
Il sera précisé plus tard. 

Toute la difficulté revient justement à trouver ce deuxième axiome de manière à ce 
que, à vitesse faible, on retrouve les lois de la mécanique classique. On veut éviter 
de considérer la matière particule par particule : on a vu que cela conduit à des 
équations affreusement compliquées à résoudre (c'est ce qui se passe en mécanique 
classique dés qu'il y a trois particules ou plus). On gardera donc le point de vue 
des fluides. 

4.1. Fluides parfaits sans pression et tenseur d'énergie-impulsion. 

Puisqu'en relativité générale, on considère que les particules sont indépendantes les 
unes des autres et que leur trajectoire ne dépend que de la métrique g, il est naturel 
de considérer la matière comme un fluide parfait sans pression. La première chose 
à faire est de donner une définition de l'énergie d'un fluide parfait sans pression par 
rapport à un observateur. Puisque les particules sont indépendantes deux à deux, 
chaque particule va se comporter comme une seule particule dans le vide, modèle 
que l'on a déjà étudié en relativité restreinte. On va voir qu'en relativité générale, 
on peut tout calculer en un point x G Ai et dans l'espace tangent correspondant 
T x Ai. Or lorsqu'on travaille sur T x Ai muni de la métrique g x , on est exactement 
dans le cadre de la relativité restreinte, cadre sur lequel on va donc s'appuyer pour 
construire la théorie. 

On commence par donner la définition suivante. 

Définition. Soit F un fluide, D un observateur et x G D. La vitesse du fluide par 
rapport à D est le vecteur vitesse de la courbe du fluide passant par x (qui peut 
être considérée comme un observateur) par rapport à D. 

On a dit plus haut que la vitesse d'un observateur par rapport à un autre n'avait 
pas de sens en relativité générale, parce que pour la définir, il faudrait décomposer 
un vecteur d'un espace tangent T y Ai dans un autre espace tangent T x Ai. Lorsque 
les deux observateurs sont au même point, il n'y a plus ce problème et on peut 
procéder comme en relativité restreinte. Donc pour préciser la définition ci-dessus, 
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notons %d le vecteur unitaire tangent à D en x et orienté positivement. Notons 
le champ de vecteurs unitaire associé à F. On écrit de manière unique 

lî{x) = k + aiD 

où k G [ïd] 1 ' (l'orthogonalité étant bien évidemment relative à g) et a G M. 
Comme en relativité restreinte, on définit 



On considère un fluide parfait sans pression F de densité de masse p dans un 
domaine O C Al, x G fi et un observateur au point x dirigé par ijj unitaire et 
orienté positivement. On a vu que la densité d'énergie de F vue par D en x était 

ou encore d'après flIII.37j) . 



e D (x) = p(x) (g x ( u (x),i D )) . 

Il faut noter que cette expression n'aurait pas de sens en relativité générale en un 
autre point que x. Cela conduit à définir la forme bilinéaire symétrique 

T X M x T X M -»■ K 

Çtf,lÈ) ^ p(x)g x (lï(x),lï)g x (lï(x),lè). 

En considérant r x pour tout x, on obtient ainsi un tenseur deux fois covariant qui 
vérifie que pour tout observateur D au point x dirigé par i D , unitaire et orienté 
positivement, on a 

t(îd,îd) = e D (x) 

où eo{x) est défini comme ci-dessus. D'autre part, on pourrait faire pour l'impul- 
sion la même construction que pour la densité d'énergie en relativité restreinte et 
avec la même démarche obtenir en relativité générale un vecteur au point x que 
l'on notera F d{%) et qui est l'analogue de eo(x) construit ci-dessus. Alors, on 
peut vérifier que si w est unitaire (i.e. g(w, vï) = 1) et (7-orthogonal à ijj, 

t x ÇvÏ, wt) = g(P D (x), v$). 
Cela justifie de donner la définition suivante 

Définition. Le tenseur r est appelé tenseur d'énergie-impulsion associé au fluide 
F. 

En fait, on confondra souvent r avec le tenseur deux fois contravariant qui lui est 
associé. On le notera toujours r. Il est clair que 

t = plt®lt, (111.38) 

!Î étant le champ de vecteurs unitaires associé à F. On montre maintenant que 

PROPOSITION III. 39. Le champ de vecteurs de composantes V^r est le champ 
de vecteurs nul si et seulement si les courbes du fluides sont des géodésiques de 
{M, g). 
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Démonstration. Soit x G fi. Prenons une base (ei, • • • , e 4 ) de T X M tel que 



Vej(x) = 0. On a alors 



= V k (plî k )lï l e l + plï k V k lî l ei 
= dïv(p~u)u + pD^u 



où D est la connexion de Levi-Civita associée à g. Compte-tenu de (IIII.17j) . le 



champ de vecteurs VkT kl ei est nul si et seulement si D^lî = 0, c'est-à-dire si et 
seulement si les courbes du fluide sont des géodésiques de (Ai, g). □ 



4.2. L'équation d'Einstein. Nous sommes maintenant en mesure de définir 
le deuxième axiome de la relativité générale. Pour cela, la stratégie est d'essayer 
de copier les modèles de la relativité restreinte et de la mécanique classique pour 
retrouver les lois de Newton pour des vitesses faibles par rapport à celle de la 
lumière. Le problème est que dans ces modèles, les observateurs galiléens jouent 
un rôle fondamental (par exemple pour définir l'énergie et l'impulsion) et qu'en 
relativité générale, on n'a aucun observateur privilégié. L'idée est alors de suppo- 
ser dans un premier temps qu'on a de tels observateurs ("presque" galiléens), de 
trouver une bonne formulation du deuxième axiome dans ce cadre et de voir que 
ce que l'on a trouvé est en fait intrinsèque et ne dépend pas de ces observateurs 
particuliers. 

Définition. Un domaine statique est un ouvert connexe fi de Ai tel que (fi, g) 
est isométrique à (/ x u,g) où / est un intervalle ouvert, u est un ouvert connexe 
de M 3 et où dans la "carte canonique" (donnée par l'isométrie de fi dans I x ou), 
la matrice de g au point (t, x 1 , x 2 , x 3 ) G/xw est donnée par 

/ -f 2 {x\x 2 ,x 3 ) \ 

gn^x 1 ^ 2 ^ 3 ) g 12 {x l ,x 2 ,x 3 ) g^x 1 , x 2 , x 3 ) 

g 21 (x l ,x 2 ,x 3 ) g 22 {x l ,x 2 ,x 3 ) g^x 1 , x 2 , x 3 ) 

\ (73i (x 1 ,;*; 2 ,^ 3 ) g^ 2 {x l , x 2 , x 3 ) g^x 1 , x 2 , x 3 ) ) 

où /, (jij : uj — > K {i G {1,2,3}) sont des fonctions suffisamment régulières pour 
que la suite ait un sens. Autrement dit, on a 

3 

git^x 1 ,x 2 ,x 3 ) = -f 2 (x l ,x 2 } x 3 ) + gki(x 1 ,x 2 ,x 3 )dx k <g> dx l 

k,l=l 

pour tout (t, x 1 ,^ 2 ,^ 3 ) G/Xw, 

Remarque III. 40. Le mot statique provient du fait que les composantes de la 
métrique ne dépendent pas du temps. 

Il n'y a aucune raison qu'il existe dans (Ai, g) un domaine statique mais Haw- 
king a montré que l'existence d'un tel domaine statique est équivalente à l'exis- 
tence d'un champ de Killing K (c'est-à-dire un champ de vecteurs engendrant un 
flot isométrique) et d'une hypersurface H de genre espace orthogonale en tout 
point au champ de vecteurs K. Le flot de K donne donc un groupe à un pa- 
ramètre d'isométries dont les orbites (ce sont les courbes intégrales de K) sont 
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g-orthogonales à H. 

Autrement dit, considérons une courbe intégrale de K. Cette courbe définit un 
observateur D. L'espace vu par D est à tout instant isométrique à (H, g) où g est 
la restriction de g k H. Ces observateurs observant toujours le même espace sont 
les analogues des observateurs galiléens en mécanique classique ou en relativité 
restreinte. 

Nous travaillons donc dans (/ x ou, g). La matière est modélisée par un fluide par- 
fait sans pression F. Rappelons que le premier axiome dit que les courbes de F 
paramétrées par le temps sont des géodésiques de (M, g). L'idée fondamentale 
pour trouver le deuxième axiome est que le fluide lui-même (y compris sa den- 
sité de masse) est lié à la métrique g. C'est ce lien que l'on cherche à déterminer 
de manière à retrouver (en approximation) les lois de Newton. Remarquons que 
les domaines statiques permettent de se ramener à la relativité restreinte ou à la 
mécanique de la façon suivante : prenons le cas où / = 1 et où g est la métrique 
euclidienne. Alors, on a deux manières de voir les choses. Soit on travaille dans 
(/ xoo,g). Dans ce cas, on retrouve l'espace-temps de la relativité restreinte. Sinon, 
on peut travailler dans I x w muni de la forme T associée à la forme bilinéaire 
—pdt 2 dont le noyau (tangent à w) est muni du produit scalaire g. On retrouve 
le modèle de la mécanique classique. Pour trouver le deuxième axiome, c'est 
avec cette vision des choses que l'on va travailler. 

Pour cela, considérons une courbe C du fluide paramétrée par c, paramétrisation 
normale positive. On écrit c dans la carte (t, x 1 , x 2 , x 3 , x 4 ) : 

c(s) = (c (s),c 1 (s),c 2 (s),c 3 (s)) 

et on note k (s) = (c[(s) , c' 2 (s) , c' 3 (s)) et 7?*(s) = (c'((s) , c^s) , c 3 '(s)) Ecrire c dans 
cette carte revient à regarder C à travers les yeux^d'un observateur galiléen D, 

c'est-à-dire une courbe intégrale de K. Le vecteur k représente la vitesse de C par 
rapport à D et le vecteur a est le vecteur accélération de C vue par D. En fait, 
pour travailler vraiment avec le modèle de la mécanique classique, il faudrait que 
c soit une paramétrisation normale pour T = — et donc normaliser c pour avoir 
c'q = 1. Cependant, comme g c (s)(c'(s), c'(s)) = —1, on a 

-f%(s) + \\'t(s)\\- 9 = -l 

c'est-à-dire 

(c'o) 2 = 1± )P^ (IH.41) 

Maintenant, on doit supposer qu'on est proche du modèle de la mécanique classique 
donc / est proche de 1. D'autre part, les vitesses sont supposées petites par rapport 
à la vitesse de la lumière, c'est-à-dire qu'on suppose 



(111.42) 
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ce qui fait que 

c' = o(l) (IH.43) 

(autrement dit, c est "presque" une paramétrisation normale pour la forme —dt 2 ) 
et a peut bien être considéré comme le vecteur accélération de la courbe C. Même 
si cette approche n'a rien de rigoureux, elle est physiquement cohérente. Elle va 
nous permettre de trouver par l'intuition un bon deuxième axiome dont la validité 
sera vérifiée par les observations physiques (voir le Chapitre HV|) . 



La première chose à faire est de se débrouiller pour retrouver la relation (1III.20j) 
en approximation. Pour cela, nous devons exprimer ~ct en fonction de données 
géométriques. C'est l'objet du résultat suivant : 

PROPOSITION III. 44. Les composantes du vecteurs ~ct vérifient pour tout k E 
{1,2,3} 

4(s) = -)(i + v 2 )v k s f-J2v1 jC ' tC ' J 

où Von a posé v — || k \\g et où V^/ = g k ^djf. 

Démonstration. D'après l'axiome 1, C est une géodésique de (M, g). Au- 
trement dit, D c i^c'(t) = (D est la dérivée covariante associée à la connexion de 
Levi-Civita de g). Donc 

= D d{t) {c\t)) = D c , (t) L^) + J2 D«t) U^-\ 

' 1,7 = 1 ^ ' 



Écrivons maintenant que 



q 3 q 

c>\t) + c> D c , {t) -+Y,<D c , {t) — . 



d , „ d , „ d 



(111.45) 



D ^m= c ^ D àdt + ^ D ^d-t- 

i=l 

Comme d'après flIII.51j) . pour i, k > 1, T k = 0, on obtient 
De même, on calcule que 



D ^)qI = ^ooq^- (HI.46) 



i=i 

En remplaçant dans (1111.450 et en regardant composante par composante, on trouve 
que pour tout k G {1, 2, 3} 

3 

= c k + ^Oo( X o) 2 + ^ij x i x j- 
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En utilisant (1III.51j) (voir plus bas) et (1III.41|) . la preuve de la proposition est 



complète. □ 

Revenons maintenant à ce qui nous intéresse : retrouver la relation (1III.20j) . Pour 
être "approximativement" en mécanique classique, on doit supposer que / vaut 
"presque" 1 et g est presque la métrique euclidienne. On écrit donc / = 1 + h et 
on suppose que h = o(l). On écrit aussi = ôij + o(l). Compte-tenu de (1III.51j) 
et de (1111.42p . on obtient que 

^ = -VÎi(l + o(l)). (111.48) 

Pour retrouver la relation flIII.201) . on voudrait que cette fonction h soit le potentiel 
newtonnien / qui apparaît dans la relation flIII.20j) . c'est-à-dire, en vertu de la 
relation flIII.19j) que 



A s h = 4vrp. (111.49) 

Or on calcule que 

PROPOSITION III. 50. Dans la carte (t, x 1 , x 2 , x 3 ), la courbure de Ricci de g 
vérifie 

Démonstration. On commence par calculer les symboles de Christoffel de 
la connexion de Levi-Civita associée à g dans cette carte. Nous notons "0" la 
coordonnée associée à t et utilisons les conventions d'Einstein. On rappelle que 
par définition, on a pour tous i, j, k G {0, 1, 2, 3} 

= \g kl {digij + djgu - digij) 
et que = T^. Donc si i, k G {1, • • • , 3}, 

r° = r* = o ; r° = jdj et r fc = f g k %f. (in.si) 

Maintenant, on sait que la courbure de Ricci s'exprime dans une carte en fonction 
des symboles de Christoffel (voir l'appendice) grâce à la formule suivante : 

p api a ri i pi rtn pi rm 

-fl-a/3 — UiL a p U/3L ai -r* 1 im L a/3 1 p m L ia 

où l'on a noté R a p les composantes du tenseur de Ricci dans la carte considérée. 
On a donc : 

p f) pi f) pi i -pm-pi -pm-pi 

-n-00 — <Ji L 00 U L iO 00 1 mi 1 iO 1 mO 

c'est-à-dire en remplaçant les symboles de Christoffel par leur valeur : 

#00 = W9%f) + fïLg^djf - 2\df\l (IH.52) 

On a utilisé le fait que puisque / ne dépend pas de t, \df\g = \df\ g . Maintenant, 
on calcule 
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En écrivant que V^g -1 = 0, on obtient 



ce qui donne 

di{fg ij d ô f) = \dff 3 - f{d 3 f)g^r im - f(d 3 f)g im Ti m + 

Rappelons que V opérateur de D'alembert ou d'alembertien est l'analogue rieman- 
nien du laplacien. Il est défini en coordonnées par 

= -y" (fy/ - rtAf) ■ 

Il est fréquent de conserver les notations riemanniennes en géométrie lorentzienne 
(par exemple en ce concerne les courbures) mais pour le d'alembertien, une no- 
tation différente indique la différence de nature entre ces deux opérateurs : le 
laplacien est elliptique alors que le d'alembertien est hyperbolique. 

Reprenons notre calcul. Nous obtenons ainsi 

àiWàif) = W\ 2 S - mf)g mj r\ m - /: :,/•. 

En remplaçant dans ( IIII.52p . on a 



R 00 = -fn g f-\df\ 2 s . (111.53) 

oo - /« 



On calcule maintenant en utilisant que g° l = —f 2 S° l et que T™ = \d m f 



f J = -g 13 (fdijf - ,/t!/4/) 

= fA s f + g 00 T™d m f 

= fAgf - \df\ 2 g. 

En revenant à flIII.531) . on obtient 

-Roo = —fA s f 

ce qui termine la démonstra-tion de la proposition IIII.50I □ 

De cette proposition, on déduit puisque f = 1 + h avec h = o(l), que A g h = 
—Rie (J^, J^) (1 + o(l)). En revenant aux notations tensorielles, pour avoir la re- 
lation ( 1111.49p . il faut donc imposer 

R 00 = 4vrp. 

Rappelons que le tenseur d'énergie-impulsion est défini par 

t = pu <S> u 

et comme d — u, 

r 00 = p(c' ) 2 = p(l + o(l)) 
en utilisant (1111.43p . La relation dIII.49|) est donc satisfaite si on suppose que 

Rie = 4ttt. 
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Remarque III. 54. Il suffit que cette relation soit satisfaite sur la composante 00 
pour avoir (1III.49j) mais pour avoir une équation intrinsèque, on l'impose comme 



étant une égalité tensorielle. 

Malheureusement, la proposition IIII.391 implique que l'on doit avoir 

V% = 

ce qui n'a aucune raison d'être vrai en général. Par contre, on remarque que le 
tenseur dit tenseur d'Einstein 

1 

2' 

(où R := g kl Rki est la courbure scalaire) vérifie cette condition (i.e. V 1 ^- = 0). 
Cette relation se déduit de l'identité de Bianchi sur la courbure de Riemann. D'où 
l'idée de poser 

Rie - ^Rg = 8ttt. (111.56) 



Cette relation conserve la relation (1III.49|) . Pour le voir, contractons chaque côté 
de l'égalité par g % K Comme g % ^gij = 4 et comme = pc^c'- (car u = c'), on 



obtient R — 2R = Sirpc'^g^ . Mais d'après flIII.42j) . c- = o(l) si % ^ et on a déjà 



vu que c' = 1 + o(l) (d'après fllll.43|> ). On obtient donc -R = -8?rp(l + o(l)) 



puisque g 00 = — 1 + o(l). On en déduit en utilisant l'équation 56[) que 



A s h = -(1 + o(l))R 00 = -(1 + o(l))(-Rg 00 + 8vrr 00 ) 
= -(1 + o(l))(-4vrp + 87rp) 
= -(1 + o(1))4ttp 
et on retrouve ( 1III.49I) . 

Si on ajoute à un terme de la forme Ag (où A est un réel), on garde la re- 
lation (1III.55j) . Par contre, on perd la relation ( 1III.49I) . Prendre A = conduit à 
considérer que l'univers est en expansion (voir le chapitre suivant) ce que refusait 
complètement Einstein. C'est pourquoi il a ajouté ce terme. L'équation garde sa 
cohérence (i.e. la relation ( 1III.55P ). On peut même montrer que c'est le seul terme 
que l'on peut ajouter pour garder la cohérence de l'équation. Si l'on suppose que 
A est petit, on est proche des lois de Newton. C'est cette équation intrinsèque (on 
n'a pas besoin d'avoir de domaine statique pour la considérer) que l'on gardera. 



Autrement dit, on est maintenant en mesure d'énoncer les deux axiomes qui 
régissent la matière lorsqu'on considère qu'il n'y a qu'un fluide parfait pression 
dans l'espace-temps : 



Axiome 1 : Les courbes du fluide paramétrées par leur temps propre sont des 
géodésiques de (Ai, g). 
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Axiome 2 : La matière et la métrique sont liées par l'équation d'Einstein 

Rie - ^Rg = 8ttt - Ag (111.57) 
où A est une constante, appelée constante cosmologique, que l'on peut choisir. 

Remarque III. 58. Si la matière n'est pas modélisée par un fluide parfait, on 
conserve tout de même ces deux axiomes sous cette forme mais c'est le tenseur 
d'énergie-impulsion qui prendra une autre forme. 

Considérons seulement l'axiome 2. La relation (IHI.55P implique que = et 

la proposition IIII.391 implique alors l'axiome 1. On considère donc que le com- 
portement de la matière est régi par l'axiome 2 seulement. L'axiome 1 est 
alors automatiquement vrai. 

À partir de maintenant et dans tous les chapitres qui suivent, nous nous 
plaçons toujours dans l'espace-temps de la relativité générale et nous 
supposerons que le comportement de la matière est régi par l'axiome 2 
seulement. 

Remarque III. 59. Vers la fin de sa vie, Einstein a admis qu'il avait fait une 
erreur en refusant d'admettre que A = 0. En tout cas, si la constante A n'est pas 
nulle, elle doit être très petite. En effet, ce terme additionnel détruit la relation 
(IHI.49j) . Par conséquent, on ne retrouve plus les lois de la mécanique classique à 
petite échelle. Les mesures physiques récentes tendent à montrer que A > est 
non nulle, petite, mais pas aussi petite que ce que l'on pensait. 

Remarque III. 60. La constante cosmologique fournit également une explication 
possible à l'énergie noire dont il est question dans le Paragraphe El 

Remarque III. 61. Pour établir l'équation d'Einstein, on a travaillé avec la cour- 
bure de Ricci mais on aurait pu penser à poser R = —Airp ce qui est a priori suffi- 
sant pour avoir la relation (lIII.49p . Physiquement, cela n'aurait pas pu modéliser 
correctement la réalité car cette relation faisait intervenir seulement la densité de 
masse et pas les courbes du fluide. On aurait aussi pu penser à utiliser le tenseur 
de Riemann mais les équations auraient été beaucoup plus compliquées et les ob- 
servations physiques montrent que le choix de l'axiome 2 ci-dessus est un modèle 
très proche de la réalité. 

5. Complément sur le tenseur d'énergie-impulsion 

Résumons la situation. On a commencé par se donner une variété lorentzienne 
(Ai, g) de dimension 4, supposée être un bon modèle pour l'univers. Ensuite, on a 
fait l'hypothèse que toute la matière se présentait sous la forme d'un fluide parfait 
sans pression F et on lui a associé un tenseur, appelé tenseur d'énergie-impulsion, 
défini par r = plî <g) ~ït où p est la densité de masse de F et où ~u est son champ 
de vecteurs unitaire associé. On alors montré que pour retrouver les lois de la 
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mécanique classique lorsque l'on se place à échelle humaine, il était naturel d'im- 
poser que le tenseur d'énergie-impulsion et la métrique soient reliés par l'équation 
d'Einstein flIII.57j) . 

Tout mathématicien sera gêné par cette approche et portera plutôt le regard sui- 
vant sur la théorie : on se fixe une variété lorentzienne (Ai, g) et on définit le 
tenseur d'énergie-impulsion associée en posant : 

T = ^-(Ric-)-Rg + kg). (111.62) 

Ainsi, la matière est réduite à une définition purement géométrique, dont les ca- 
ractéristiques sont contenues dans la métrique. Cette manière de voir les choses est 
tout à fait cohérente mais correspond réellement à un raisonnement de mathémati- 
cien : on se fixe un objet mathématique (la métrique) que l'on utilise pour définir 
un objet physique (la matière). Le physicien part plutôt d'un objet physique (le 
tenseur d'énergie-impulsion qui contient toute l'information sur la matière et à 
qui on attribue des propriétés différentes selon la situation parce que justement 
on n'est pas capable d'avoir un modèle universel de matière) et lui associe des 
propriétés géométriques de manière à retrouver des lois physiques cohérentes. 

Arrêtons-nous un instant sur le point de vue du mathématicien. La première re- 
marque que l'on peut faire est que si l'on se fixe une variété lorentzienne (Ai, g) 
quelconque et que l'on définit le tenseur d'énergie-impulsion associé par la formule 
(IIH. 621) . il n'y aucune raison a priori que le r s'écrive sous la forme r = p~Ù, ® u . 
Mais il s'agit là d'un faux problème : r prend cette forme particulière parce qu'on a 
modélisé la matière par un fluide parfait sans pression mais une forme plus générale 
pour r correspond à une forme de matière plus générale dans laquelle toutes les on- 
teractions auront été prises en compte. La théorie se construit de la même manière 
et aboutit à la même équation à condition de donner la bonne forme au tenseur 
d'énergie- impulsion. On va voir que toutes les grandeurs physiques de la matière, 
exceptées celles qui concernent l'électromagnétisme, se déduisent de cette manière. 
Nous n'expliquerons pas, comme nous l'avons fait dans le cas d'un fluide parfait 
sans pression, les raisonnements physiques qui conduisent à imposer cette forme 
du tenseur r. 

Le problème revient à classifier les variétés lorentziennes selon la forme de leur 
tenseur d'Einstein. Cette classification est faite par exemple dans [Haw73j. Soit 
donc r défini par flIII.62p . La première remarque est qu'il n'est pas évident que la 
donnée du tenseur r suffise à construire canoniquement le champ de vecteurs lî 
associé au fluide. On verra que c'est possible sur tout domaine où il y a effective- 
ment de la matière (s'il y a seulement de l'électromagnétisme, cela ne suffit pas). 
Plaçons-nous donc sur un tel domaine. Alors, on peut démontrer qu'il existe 

(1) des fonctions A, B uniques; 

(2) un unique 2-tenseur tt à trace nulle tel que u G ker(7r) ; 

(3) un unique champ de vecteurs ~^ orthogonal à u 
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tels que dans une carte quelconque 



Tij = AuiUj + B{gij + UiUj) + 7Ty + (qiUj + qjui). (III. 63) 

En particulier, on remarque que A = TijU % u^ B = ^Tij(g 1 ^ + u l v?) et q % = 
—Tjkui (g kt + u k u l ). Sur un domaine où lî se construit canoniquement, il n'y a 
pas d'ambigùité sur la définition de ces quantités. La terminologie couramment 
utilisée est la suivante : au point x G A4 

- A(x) est la densité d'énergie vue par lï(x) (observateur en un point) et ce, même 
si u n'est pas le champ de vecteurs canonique ; 

- B{x) est la pression vue par lï(x) ; 

- ir x est le tenseur de pression anisotrope vu par u (x) ; 

- ~<f (x) est le flux d'énergie vu par lî(x). 

On va maintenant commencer la classification proprement dite. Pour respecter les 
conventions habituelles, on va travailler avec le tenseur d'Einstein E = 8ttt (on a 
supposé que la constante cosmologique était nulle) : 

Type : E= 

Les domaines où le tenseur d'Einstein est identiquement nul correspondent aux 
parties vides de l'espace-temps. On pourrait penser que leur étude est triviale et 
sans intérêt mais ce n'est pas le cas (voir par exemple le Chapitre (jV|) ). 

Type I : E admet en tout point 

- une valeur propre —fi < d'espace propre S _ M de dimension 1 et de genre temps ; 

- une deuxième valeur propre A g] — /i, fi[ d'espace propre E\ de dimension 3 
orthogonal à 

Autrement dit, il existe une base g-orthonormée dans laquelle la matrice de E a 
la forme 



E = 
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Ces domaines représentent les parties de l'espace-temps où il y a de la matière 
mais pas d'électromagnétisme : on est en présence d'un fluide parfait. On définit 
alors sans ambiguité 

- le champ de vecteurs u G unitaire orienté positivement ; 

- la densité d'énergie /i ; 

- la pression du fluide A. 

Le tenseur E se décompose alors de manière unique 

Eij = jj,UiUj + X(g ij + UiUj). 



Type II : E admet 



5. COMPLÉMENT SUR LE TENSEUR D'ÉNERGIE-IMPULSION 
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- une valeur propre —fj, < d'espace propre £_ M de dimension 1 et de genre temps ; 

- une deuxième valeur propre Ai d'espace propre S\ 1 de dimension 1 orthogonal à 

- une troisième valeur propre A 2 d'espace propre £\ 2 de dimension 2 orthogonal à 

Autrement dit, il existe une base g-orthonormée dans laquelle la matrice de E a 
la forme 
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A 2 





E = 



Ces domaines représentent les parties de l'espace-temps où il y a à la fois de la 
matière et un champ électromagnétique. On définit alors sans ambiguité 

- le champ de vecteurs lî G E-^ unitaire orienté positivement ; 

- la densité d'énergie \i ; 

- la densité d'énergie du fluide // — |(A 2 — Ai) ; 

- la pression du fluide \{\\ + A 2 ) ; 

- la pression électromagnétique |(A 2 — Ai) ; 

- le tenseur électromagnétique n à trace nulle défini par la décomposition de E 
ci-dessous : 



Ai + A 2 A 2 — Ai 



Type III : E admet 

- une valeur propre —\i < d'espace propre £_ M de dimension 2 ; 

- une deuxième valeur propre A = fi d'espace propre de dimension 2, de genre 
espace, orthogonal à 

Autrement dit, il existe une base g-orthonormée dans laquelle la matrice de E a 
la forme 



E = 
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Les domaines où le tenseur d'Einstein prend cette forme représentent les domaines 
vides de matière mais possédant un champ électromagnétique. Dans ces domaines, 
il n'y a pas de choix canonique de lî. On n'est donc pas capable de décrire 
correctement l'électromagnétisme. 



Type IV : E a comme seule valeur propre. L'espace propre associée Sq est 
de dimension 3, ne contient aucun vecteur de type temps et ses vecteurs isotropes 
forment un sous-espace de dimension 1 (£ est tangent au cône de lumière). 

Il existe alors une base g-orthonormée dans laquelle la matrice de E a la forme 
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-1 1 \ 

-110 

oooo ■ 

/ 

Ces domaines représentent physiquement les parties de l'espace-temps sans matière, 
où il y a seulement une onde électromagnétique dont la direction de propagation 
est donnée par la direction isotrope de Sq. Dans ce cadre, le tenseur d'Einstein 
prend la forme suivante : 



E = 



G = v~t ®~t (111.64) 

où v > et où i est un champ de vecteurs indiquant le sens de propagation de 
l'onde électromagnétique. Remarquons que l'on a fait un léger abus de notation 
en ne distinguant pas la forme covariante et contravariante de G. Il est important 
de noter que la forme (1III.64|) n'est pas canonique : si la direction du champ 

de vecteurs i est fixée, il n'est défini qu'à un scalaire multiplicatif près. En effet, 
étant de type lumière, il ne possède pas de normalisation canonique. 

Remarque III. 65. Cette classification n'est pas complète. Nous ne donnons que 
les situations physiques les plus courantes. Les autres formes possible du tenseur 
d'énergie-impulsion sont plus difficiles à décrire. 



6. Les limites de la relativité générale : l'électromagnétisme 

En relativité générale, l'électromagnétisme est décrit par un 2-tenseur F qui s'ajoute 
au tenseur d'énergie-impulsion sous la forme suivante : 

Ty = F ik Fj - \g l3 F kl F kl . (111.66) 

Supposons maintenant que le tenseur d'énergie-impulsion soit connu explicitement 
dans une région de l'espace-temps. Alors on est capable de retrouver toutes les ca- 
ractéristiques de la matière (Type I ou II) mais on est incapable de retrouver F à 
partir de la donnée de T. Une autre manière de le dire est qu'il existe une infinité 
de 2-tenseurs F qui donnent la même forme à T lorsqu'il est défini par ( 1HI.66P . Il 
s'agit là d'une vraie difficulté qu'Einstein à essayé de résoudre jusqu'à sa mort : 
en effet, sans la forme exacte du tenseur F, on est incapable d'écrire les équations 
de Maxwell qui décrivent précisément les effets des champs électromagnétiques. 

Des travaux existent pour combler cette lacune mais toutes les théories cohérentes 
ne se limitent pas au cadre strict de la relativité générale telle que décrite dans ce 
texte. Un moyen de faire est de considérer un fibré au-dessus de M.. 



7. ÉNERGIE ET MATIÈRE SOMBRE 
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7. Energie et matière sombre 

L' énergie noire (ou énergie sombre) et la matière noire (ou matière sombre) consti- 
tuent deux des plus grandes énigmes de la cosmologie moderne. 

Commençons par l'énergie noire. D'après l'équation d'Einstein sans constante cos- 
mologie, l'univers est en expansion. Cependant, les mesures faites montrent que 
cette expansion est beaucoup plus rapide qu'elle ne devrait l'être. Il semble qu'une 
"énergie répulsive", dont on ignore tout, agit à grande échelle pour accélérer cette 
expansion. Cette énergie est appelée énergie noire. 

Passons maintenant à la matière noire. En mesurant l'intensité lumineuse d'une 
galaxie, on est capable de déterminer approximativement sa masse. Or toutes les 
mesures physiques montrent que la vitesse de rotation des galaxies spirales est 
beaucoup plus grande que ne le permet sa masse ainsi mesurée. Pour qu'une telle 
vitesse soit possible, il faut que la masse réelle de la galaxie soit beaucoup plus 
grande que sa celle estimée en fontion de son intensité lumineuse. Cette "matière" 
manquante est appelée matière sombre ou matière noire. 

Aussi bien l'énergie noire que la matière noire font l'objet de recherches inten- 
sives. On pourrait classer ces recherches en deux catégories : certains pensent 
que ces phénomènes n'ont pas d'origine physique mais que ce sont simplement les 
lois mathématiques qui gouvernent l'univers (c'est-à-dire principalement l'équation 
d'Einstein) qui doivent être modifiées. Au contraire, certains physiciens réfutent 
complètement l'idée que l'énergie noire et la matière noire puissent être purement 
mathématiques, et que les effets observés ne soient que la manifestation d'un terme 
supplémentaire dans une équation. Ils cherchent donc des causes physiques à ces 
phénomènes, par exemple en essayant de détecter de nouvelles particules. 

Nous allons plutôt discuter ici des approches mathématiques de ces problèmes. En 
ce qui concerne l'énergie noire, il semblerait que prendre une constante cosmolo- 
gique bien choisie dans l'équation d'Einstein suffise à expliquer les observations 
faites. Malgré tout, nous insistons bien sur le fait que cette explication n'est pas 
suffisante pour de nombreux physiciens, et que des recherches physiques sont tou- 
jours activement menées sur le sujet. Pour bien comprendre pourquoi la constante 
cosmologique modifie les propriétés de l'univers, faisons la remarque suivante : 
plaçons-nous dans une région vide de l'espace-temps, c'est-à-dire un endroit où 
p = 0. Alors on a 

Rie = -Rg — Ag. 

En contractant par g l i des deux côtés de l'équation, on trouve R = 4A c'est-à-dire 
que g a une courbure non nulle. En particulier, les géodésiques dans le vide ne 
sont pas celles d'un espace plat : cette constante A a pour effet de modifier les 
trajectoires des particules. 



58 



III. DE LA MATIÈRE DANS L'ESPACE-TEMPS 



En ce qui concerne la matière noire, de nombreuses approches mathématiques 
ont été tentées. Nous expliquons ici brièvement celle très récente de Bray [BrlO] . 
Il est difficile de dire si elle est meilleure ou non qu'une autre. Il faudrait pour 
cela faire des mesures précises. Le problème qui se pose lorsque quelqu'un pro- 
pose un nouveau modèle est de convaincre une équipe de physiciens de faire les 
mesures nécessaires, ce qui, bien souvent, demande d'avoir un budget important 
spécifique. Néanmoins, la formulation de Bray permet de simuler numériquement 
des images de galaxies spirales qui d'un point de vue visuel en tout cas, sont assez 
convaincantes comparées aux photos des galaxies réelles (NGC1300, NGC4314, 
NGC3310, NGC488, M87, NGC1132). Il faut savoir que l'existence de galaxies 
spirales ne découle pas des équations d'Einstein et que leur existence reste à ce 
jour une énigme non résolue. 

L'équation d'Einstein est une équation portant sur la métrique mais pas sur la 
connexion : à chaque métrique, on associe la connexion de Levi-Civita. L'idée de 
Bray est trouver une équation portant à la fois sur la métrique et la connexion. Au- 
trement dit, à une métrique donnée, on associera une perturbation de la connexion 
de Levi-Civita. On verra dans le Chapitre IVIII que la métrique g est solution de 
l'équation d'Einstein dans le vide si et seulement si elle est point critique de la 
fonctionnelle 



L'idée est alors de considérer non plus une fonctionnelle dépendant uniquement de 
la métrique, mais dépendant de (g, V) où V est une connexion. Sans rentrer dans 
les détails, résoudre ce problème revient à trouver une fonction / telle que 



où Ho et T sont des constantes universelles et où l'on a considéré le problème avec 
constante cosmologique A. La fonction / représente la densité de matière noire. La 
formulation présentée ici est celle d'un univers vide, c'est-à-dire sans matière ba- 
ryonique (la matière habituelle, faite de particules connues). Pour un univers sans 
matière noire, c'est-à-dire avec / = 0, on retrouve l'équation d'Einstein usuelle. 
Remarquons que la deuxième équation est l'équation de Klein-Gordon évoquée 
dans le chapitre IVIII On peut montrer que des solutions avec des fonctions / non 
nulles existent et Bray en a fait une estimation numérique, permettant de décrire 
l'influence de la matière noire ainsi modélisée sur la matière baryonique. Il obtient 
ainsi les images évoquées plus haut. 
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CHAPITRE IV 



Le Big-Bang 

Comme on va le voir, en faisant quelques hypothèses naturelles sur l'espace-temps, 
l'équation d'Einstein implique l'existence d'un "temps 0", c'est-à-dire d'un "com- 
mencement de l'univers". Cette découverte de Friedmann, Hubble et Lemaître, 
établie entre 1922 et 1927, va à l'encontre de l'intuition. Mais n'est-elle pas que 
pure spéculation mathématique? D'ailleurs le terme de "Big-Bang" a été inventé 
à titre de sarcasme par l'astrophysicien anglais Hoyle. 

Même si plusieurs éléments démontrent que la relativité générale est un bon 
modèle physique (citons par exemple les mirages gravitationnels ou le périhélie de 
Mercure évoqués dans le Chapitre EJ , la prédiction puis la vérification de l'exis- 
tence du rayonnement cosmisque vont venir confirmer cette théorie et établiront 
définitivement la relativité générale comme un modèle physique cohérent. 

L'idée est que l'existence du Big-Bang implique que, dans l'univers primordial, 
la densité de matière était énorme et la température moyenne très élevée. En 
particulier, l'intensité lumineuse devait nécessairement y être importante. Si la 
théorie est vraie, que reste-t-il de cette lumière ? Gamow a prédit en 1948 qu'elle 
devait toujours être présente à notre époque sous forme de photons uniformément 
répartis dans l'univers et de longueur d'onde de l'ordre du millimètre. En 1965, 
on a pu vérifier l'existence de telles ondes lumineuses. L'étude de leur spectre 
montra par la suite leur provenance thermique, confirmant de manière frappante 
l'existence du Big-Bang. 



1. Hypothèses 

Nous nous plaçons dans l'espace-temps (Ai, g) de la relativité générale. Le but de 
ce chapitre est de montrer comment l'équation d'Einstein conduit à l'existence du 
Big-Bang. Il est bien évidemment vain d'essayer de trouver LE tenseur d'énergie- 
impulsion modélisant toute la matière de l'univers. On est donc contraints de 
faire des hypothèses raisonnables adaptées à chaque situation physique. Dans ce 
chapitre, nous regardons des propriétés globales de l'espace-temps et nous nous 
plaçons donc à grande échelle. Nous allons supposer les faits suivants : 

Hypothèse 1 : La matière dans l'univers est un fluide parfait sans pression. 
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Hypothèse 3 : l'univers est spatialement homogène. Cela fournit une notion d' 
"univers à un instant donné" . 

Hypothèse 3 : l'univers est isotrope. Cela signifie qu'en tout point de l'univers à 
un instant donné, "l'espace est le même". 

On a déjà justifié l'hypothèse 1 mais il faut bien comprendre pourquoi, à grande 
échelle au moins, elle est physiquement raisonnable : si on voulait prendre un lan- 
gage de mécanique classique qui nous est plus familier, on dirait que les forces 
électromagnétiques et les chocs ont une action négligeable devant l'attraction uni- 
verselle (i.e. devant les conséquences de la courbure en relativité générale) quand 
on se place au niveau des étoiles et des galaxies. L'hypothèse 2 semble être la plus 
hasardeuse mais donne un sens à considérer l'univers à un instant donné. Que 
cette notion puisse se définir répond à une intuition commune et on s'aperçoit 
que dans presque toutes les situations, les physiciens s'arrangent d'une manière 
ou d'une autre pour introduire une notion, même vague, de temps absolu (voir 
aussi la version forte de la conjecture de la censure cosmique dans le Chapitre IVll 
L'hypothèse 3 dit que la matière est "uniformément répartie" dans l'univers. C'est 
faux à petit échelle : il y a évidemment plus de matière à l'intérieur d'une étoile 
que dans le vide qui l'entoure. Cependant, à grande échelle, on voit la matière 
comme les particules d'un fluide homogène. De même, si on regarde la mer, on a 
l'impression que l'eau qui la compose est homogène alors qu'en se plaçant à très 
petit échelle, il y a plus de concentration de masse dans le noyau des atomes ou les 
électrons que dans le vide entre ces particules. Mais à notre échelle, nous ne voyons 
pas ces irrégularités. Nous considérons qu'il en est de même à grande échelle avec 
les étoiles. 

On va voir comment, de ces trois hypothèses physiquement plausibles, on déduit 
l'existence du Big-Bang. De nombreuses observations physiques prédites par la 
théorie et observées ensuite sont venues confirmer la validité de ces raisonnements 
(en particulier, comme expliqué plus haut, l'existence du rayonnement cosmique) et 
sont autant de preuves qui montrent que ces trois hypothèses sont vraies à grande 
échelle. On va dans un premier temps les traduire mathématiquement. Ensuite, on 
les étudiera pour aboutir au Big-Bang. 

2. Traduction mathématique des hypothèses 1, 2 et 3 

L'hypothèse 1 a été étudiée dans le chapitre précédent et conduit à travailler avec 
l'équation d'Einstein flIIL57p . Traduisons maintenant l'hypothèse 2. 

Définition. Soit Q un domaine (ouvert, connexe) de l'espace-temps Ai. On dit que 
M est spatialement homogène s'il existe un groupe de Lie G d'isométries qui opère 
librement sur Q et tel que chaque orbite de G soit une sous-variété de dimension 
3 de genre espace de Q. 

En particulier, chaque x G Q appartient à une seule orbite que l'on notera £ x qui 
correspond physiquement à l'univers à un instant donné t. 
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L'hypothèse 3 se traduit de la manière suivante : 

Définition. Un domaine Q spatialement homogène est isotrope si pour tout point 
x G £1, il existe un groupe d'isométries H de S x (qui est par définition l'orbite de 
x sous G) qui laisse fixe x et tel que le groupe H induit par H sur (T x (£ x ), g/e x ) 
soit isomorphe à S 0(3). 

Le résultat suivant est assez difficile à montrer mais est fondamental pour conti- 
nuer. 

THÉORÈME IV. 67. Soit Q de (Ai, g) spatialement homogène et isotrope. Alors, 
Q est isométrique à (V\ x V, —dt 2 + a(t) 2 g) où V\ est une variété de dimension 1 
(donc un intervalle ouvert de M. ou le cercle S 1 ), où V est une variété de dimension 
3, où g est à courbure sectionnelle constante sur V et où a :V\ — >]0, +oo[ est une 
fonction lisse. 

De tels espaces sont appelés espaces de Robertson-Walker. 

Pour modéliser l'espace-temps, on considère que V\ est un intervalle / ouvert. Au- 
trement dit, on suppose (peut-être à tort) que V\ ^ S 1 , hypothèse qui conduirait 
à avoir des courbes fermées de type temps (un observateur suivant cette courbe 
revivrait éternellement les mêmes événements). Le fait que g soit à courbure sec- 
tionnelle constante ne laisse pas beaucoup de choix pour V : si on suppose que 
V est simplement connexe et complète (ce qui physiquement paraît raisonnable), 
alors (V,g) est isométrique soit à la sphère S 3 , soit à M 3 soit à l'espace hyperbo- 
lique H 3 . Si on ne suppose plus la simple connexité, alors (V,g) peut aussi être 
isométrique à l'un des quotients de ces trois espaces. Par contre, on peut montrer 
que seul l'espace projectif KLP 3 est isotrope. 

Dans la suite, on travaillera donc dans I x V (I intervalle ouvert et V 
n'est pas précisé mais appartient à la liste ci-dessus) muni de la métrique 
g := —dt 2 + a(t)g où g est une métrique sur V de courbure sectionnelle 
constante K. 

Nous montrons le résultat suivant : 

Proposition IV. 68. 

(1) Le champ de vecteurs unitaire lî associé à la matière (i.e. au fluide parfait 
sans pression qui la modélise) est g-orthogonal en tout point aux orbites 
de G. 

(2) La distribution de masse p associée à la matière ne dépend que de t. 

(3) Soit ou C V un domaine relativement compact de V . Alors la masse de la 
matière contenue dans ou est constante en temps ( évidemment on utilise 
pour cela la notion d'univers à un instant donné évoquée plus haut). 

Remarque IV. 69. Ce que disent les points 2 et 3 de cette proposition d'un point 
de vue physique n'est bien sûr vrai qu'à grande échelle. En effet, le point 2 dit qu'à 
tout instant, la matière est uniformément répartie dans l'univers tandis que le point 
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3 assure qu'à un endroit donné, il y a toujours la même quantité de matière. C'est 
vraiment une propriété propre au fluide mais fausse quand on considère la matière 
comme une ensemble de particules. 

DÉMONSTRATION. 

(1) Ecrivons en un point x 

lî = U i + Uy 

où lî i et ity sont tangents respectivement à I et à V . Prenons maintenant 
une carte {t, x±, x 2 , x 3 ) au voisinage de x telle 

- (l> ST> â£î> é) est ^-orthonormée ; 

- est le vecteur unitaire orienté positivement et ^-orthogonal à E x ; 

- -Jj^ est colinéaire à u v- 
Rappelons que d'après (1III.38|) 

= pdu ® du 

(où dlî = g(-,lt)). Autrement dit, dans cette carte, on a pour i,j G 
{1,2,3} (on note la coordonnée associée à t) = sauf si i — j — 1 
auquel cas on a ri ; i = Or puisqu'on travaille dans un domaine 

isotrope et que r s'exprime avec la courbure de Ricci et la métrique, le 
tenseur r x en x doit être invariant par les isométries de l'espace tangent 
en x à l'espace £ x ce qui n'est pas le cas d'après ce qui précède sauf si 
lt v = 0. 

(2) L'équation d'Einstein dit que le tenseur r est invariant sous l'action de G. 
De plus, d'après (1IH.38|) . p = —r^g^ donc p est invariante sous l'action 



de G ce qui montre, puisque les orbites de G sont les espaces {t} x V que 
p ne dépend que de t. 

(3) Soit u un domaine relativement compact de V et t, t' G I (t < t') deux 
instants distincts. Notons W = [t,t'\ x u. Puisque div(plt) = 0, on a, par 
le théorème de Stokes, 



= / div(plt)dvg = / pg(u,lt)dsg 

Jw J[t,t']xduj 

+ / pg(!Î ,lt)ds g + / pg{lt,lt)dsg. 

J \t\XU) J(t'\XW 



{t}xui J {t'}xw 

où dans les intégrales ci-dessus, n et ds g représentent respectivement 
le vecteur unitaire sortant g-orthogonal à l'hypersurface considérée et 
l'élément de volume induit par g sur l'hypersurface considérée. D'après 
le point 1 de cette proposition, 



/ pg{lt,lî)dsg = 0. 

J\t,t']xduj 



'[t,t']xduj 

De plus, sur {t} x ui, ~rt = —lî tandis que sur {t'} x tu, ~rt = lî. On 
obtient ainsi 



pdsg = / pdsg (IV. 70) 

(i|xw J{t'}xw 



3. BIG-BANG ET BIG-CRUNCH 

qui est la traduction mathématique du point 3 de la proposition. 
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On peut remarquer que comme corollaire presque immédiat de la Proposition 
IIV.681 on obtient 

COROLLAIRE IV. 71. Il existe une constante c > telle que 

P(t) 



a(t) 3 
pour tout t G I . 

Démonstration. D'après (lIV.70p . la fonction 



t I— 7- / pdSg 

i{t}xu 

est constante sur /. Or, sur {t} x eu, ds g = a(t) 3 dvg, ce qui fait que, avec le point 
2 de la Proposition IIV.68I 



pdsg = p(t)a(t) vo\g(w). 

' {t}XUl 

Cette expression ne dépend pas de t. Le Corollaire II V. 711 s'ensuit immédiatement. 

□ 



3. Big-bang et Big-Crunch 

Dans cette section, nous étudions si les hypothèses que nous avons faites conduisent 
à un Big-Bang ou à un Big-Crunch. Précisons un peu ces notions. On rappelle 
qu'avec les notations ci-dessus "l'univers à un instant donné" a un sens. Il s'agit 
simplement des orbites de x sous G, c'est-à-dire des hypersurfaces de type espace 
de la forme {t} x V. Dire qu'il y a un Big-Bang signifie qu'il y a un instant to 
passé pour lequel V s'effondre sur lui-même. Plus précisément, il y a un Big-Bang 
si inf (/) > +oo et si lim t _ s . inf (/) a{t) = 0. Il y a un Big-Crunch s'il se passe le même 
phénomène pour un instant t futur, c'est-à-dire en sup(J). L'idée est de voir à 
partir de l'équation d'Einstein (IHL57P ce à quoi peut ressembler la fonction a(t). 



3.1. Mise en équation. Pour étudier la fonction a(t), on va travailler dans 
de nouvelles coordonnées. Plus précisément, nous ferons le changement de variables 

s = a~ l (u)du, 

Jt 

to étant un point fixé de /. Remarquons que ds 2 = a(t)~ 2 dt 2 , et donc en définissant 
b sur J := s(I) par b(s) = a(t), on a, avec cette nouvelle variable sur J x V, 

g = b(s) 2 h où h = -ds 2 + g. (IV.72) 
On fait alors le calcul suivant : 
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Proposition IV. 73. On a, sur J 

b" + Kb- -Ab 3 = -ne (IV.74) 
3 3 

et 

Zib'fb- 1 + 3Kb - Ab 3 = 8vrc (IV.75) 

où K est la courbure sectionnelle de g, A est la constante de l'équation d'Einstein 
( 1III.57P et où c est la constante donnée par le Corollaire ( IIV. 71 P . 

Remarque IV. 76. On peut montrer que les équations flIV.74j) et ( IIV. 75 P sont les 
seules que l'on peut déduire de l'équation d'Einstein et des hypothèses que l'on a 
faites. 

Démonstration. Commençons par démontrer (IIV. 74p . Pour cela, on rappelle 
l'équation de Yamabe qui lie la courbure scalaire de deux métriques conformes 
(valable aussi pour des métriques lorentziennes en remplaçant le laplacien par 

4 

le d'alembertien) : si M est une variété de dimension n > 3 et si G = u n ~ 2 G 
{u G C°°(M), u > 0) sont deux métriques conformes alors, si on note Rq et Rq 
les courbures scalaires des métriques G et G 

A(n — 1) n+2 

K _ 9 } a G u + R G u = R G u— (IV.77) 

(voir par exemple [Heb97j). On applique cette formule avec n = 4, G = h, G = g 
et u = b(s) 2 (voir équation (IIV.72P ). Puisque Rh = R-ds 2 +g — Rg — 6-K", on obtient 

6D h b + 6Kb = Rb 3 

où R est la courbure scalaire de g. Comme b ne dépend que de la variable s, 
\3hb = b" (car goo — ~ 1)- On obtient ainsi 

66" + 6Kb = Rb 3 . (IV.78) 

En contractant l'équation d'Einstein (IIII.57I) . on a (on note Rij les composantes 
de la courbure de Ricci de g dans une carte) : 

g ij (Rij - ^Rgijj = g ij {^n ~ A 9ij) 



ce qui donne puisque, d'après (IIII.38j) . r^g 1 ^ = —p (car r 00 = 1 et = si 
('•./) / («'-(»)) 

R = 8vrp + 4A. (IV.79) 

En reportant ce calcul dans l'équation f]IV.78|) et en utilisant le Corollaire (IIV. 71 [) 
qui dit que p = cb(s)~ 3 , on obtient l'équation (IIV. 74p . 



Passons maintenant à l'équation (IIV.75P - L'équation d'Einstein ( IIII.57P et la rela- 
tion (IIII.38P donnent que : 



Ric g (~ït,lî) + -R- A = 8 



2 - - -«P- 
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En utilisant flIV.78jl et le fait que p = cb 3 , on obtient 

Q Q 

Ric 9 {!Î, lî) = --b" -^K + 8tt- + A. (IV.80) 
tr b z b A 

Par ailleurs, la formule de la courbure de Ricci liant deux métriques conformes 
donne 



Rte 9 = Ric h - -yib + - W h b ® V h b + 

b b 2 \ b b 1 

Puisque b ne dépend que de s, puisque Ric h Çu, u) = 0, on obtient 

Ric 9 (lï,lï) = Rie 9 

1 f d d 



b(s) 2 \ds ds 

- -> + 

En revenant à (IIV.80p . on obtient l'équation (IIV.75p . ce qui termine la démonstration 
de la proposition. □ 



3.2. Le cas A = et K > 0. On peut supposer pour simplifier que K — 1. 
En remplaçant K et A par leur valeur dans les équations flIV.74p et (II V. 751) . on 
voit qu'il existe une constante Cet telle que 

b(s) = a{\ ± cos(s + C)) (IV.81) 

où l'on a défini a := \kc. En choisissant convenablement une origine de temps, 
on peut supposer que C = 0. Puisque b > 0, J est au maximum un intervalle de 
longueur 2tt. Si J est de longueur plus petite, on peut le prolonger. On va donc 
supposer que la variété n'est pas "prolongeable" et dans ce cas, en supposant par 
exemple J =]0, 2tt[, b a un zéro en et en 2n. Il faut maintenant en déduire ce qui 
se passe pour a(t). C'est l'objet du résultat suivant : 

PROPOSITION IV. 82. Quitte à faire une translation sur I, on peut supposer que 
pour tout t G I, 

a{t) = a M -cos ( (^))) 
où O :]0, 2tt[— >]0, 2tt[ est l'application réciproque de la fonction v i— y v — sin(v). 
Démonstration. On rappelle d'abord que s est défini par 

s := s(t) = / a~ 1 (u)du 

où to est fixé dans /. D'après ( lIV.8ip . on a pour u G I 

s'(u)b(s(u)) = a(s'(u) — s'(u) cos(s(u))). 
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En intégrant cette relation entre to et t, on trouve, puisque s(to) = et puisque 
s'(u) = a^iu) 

t 

a -1 (u)b(s(u))du = a(s(t) — sin(s(t)). 

Or par définition de b, a _1 (M)6(s(-u)) = 1. Ainsi 

t — to — a(s(t) — sm(s(t)). 

Quitte à faire une translation en temps, on peut supposer que G / et prendre 
to = 0. On a alors s(t) = &(jï), ce qui donne la proposition. □ 

On voit alors que si I est maximum, I =]r ,ri[ où a — b = 2nM et alors a tend 
vers en r et en r\. 

On en déduit dans ce cas qu'il y a un Big-Bang en r et un Big-Crunch en r\. 

3.3. Le cas A = et K > 0. Avec des calculs analogues, on voit qu'il y a un 
Big-Bang mais pas de Big-Crunch (a est prolongeable jusqu'en +oo). 

3.4. Le cas A = et K < 0. Dans ce cas, on trouve qu'il y a un Big-Bang 
mais pas de Big-Crunch. 

3.5. Le cas général. Il correspond au cas où A ^ 0. Les calculs sont plus durs 
mais on arrive à des résultats de même nature. Les mesures tendraient à montrer 
que A > (pas si petit que ce que l'on pourrait penser) et que K > est très 
petit. L'étude de a(t) montre alors qu'il y a un Big-Bang qui s'est produit il y a 
environ 13.5 milliards d'années et pas de Big-Crunch. D'autres preuves physiques 
viennent confirmer ce résultat et montrer que les hypothèses que nous avons faites 
sont réalistes. 



CHAPITRE V 
Etoiles et trous noirs à symétrie sphérique 



Dans le chapitre précédent, nous avons étudié l'univers vu à grande échelle. Au 
contraire, maintenant, nous cherchons à comprendre ce qui se passe à proximité 
d'une étoile, ce qui reste dans les limites de l'observation humaine. À cette échelle, 
les lois de la mécanique classique sont approximativement vraies. Par ailleurs, on a 
vu que la constante cosmologique avait des influences globales sur l'espace-temps 
mais pour un problème local tel que celui-ci, nous allons la supposer nulle. 

Dans cette situation, il serait évidemment absurde de considérer que l'univers est 
spatialement homogène. En effet, il faut distinguer l'intérieur de l'extérieur de l'ob- 
jet étudié. On va même négliger l'influence de toute autre matière et donc faire 
l'hypothèse que l'espace-temps est vide à l'extérieur de l'étoile. Nous supposerons 
aussi que l'espace-temps est à symétrie sphérique : cela suppose que l'étoile étudiée 
soit parfaitement sphérique et qu'on néglige toute rotation (auquel cas nous n'au- 
rions eu qu'une symétrie axiale). Notre étude n'a donc aucune chance de décrire 
toutes les situations physiques. On pourra à titre de comparaison lire le Paragraphe 
|3]du Chapitre IVIIII où les trous noirs que l'on décrit ont une rotation non nulle. 

De ces suppositions, on va déduire plusieurs choses : d'abord, sous cette seule hy- 
pothèse de symétrie sphérique, on verra que, à l'endroit où la courbure de Ricci 
est nulle (i.e. à l'endroit où le tenseur d'énergie-impulsion est nul, c'est-à-dire à 
l'extérieur de l'étoile), la métrique ne peut pas avoir n'importe quelle forme. On 
connaît même très bien ce à quoi elle ressemble : on l'appelle métrique de Schwar- 
child. Dès que la densité de l'étoile, c'est-à-dire le rapport de sa masse et de son 
volume, sera trop grande, on verra apparaître de manière naturelle des domaines 
particuliers, d'où ne peuvent sortir aucun rayon lumineux. Ces domaines seront ap- 
pelés des trous noirs. On parle d' effondrement gravitationnel. À l'inverse, on verra 
apparaître des domaines qui ne laissent entrer aucune lumière. Ces domaines, ap- 
pelés trous blancs n'ont jamais été observés physiquemement. On terminera par 
un paragraphe décrivant ce qui se passe à l'intérieur de l'étoile. 



1. Variétés lorentziennes à symétrie sphérique en espace 

Définition. Une variété lorentzienne (Ai', g) est à symétrie sphérique en espace 
s'il existe un sous-groupe G des isométries de (Ai', g) isomorphe à S 0(3) tel que 
l'orbite de tout point de Ai' soit une surface (sous- variété de dimension 2) de genre 
espace et difféomorphe à la sphère S 2 standard. 
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À première vue, cette définition est étonnante parce elle interdit à G d'avoir des 
points fixes. Une définition qui pourrait paraître plus naturelle est la suivante : 

(A4', g) est à symétrie sphérique en espace s'il existe un observateur D tel qu'en 
tout point p G D, l'espace vu par cet observateur (qui est une sous-variété de 
dimension 3 de genre espace) admet un groupe d'isométries isomorphe à S 0(3) tel 
que l'orbite de tout point Q ^ p est difféomorphe à S 2 . 

Dans cette définition, les points de l'observateur D sont fixes. Cependant, dans la 
suite A4' ne sera pas égale à A4 toute entière (d'où la distinction de notation) mais 
au complémentaire de l'objet considéré (étoile ou trou noir). Les points fixes de G 
seront donc à l'extérieur de A4', au coeur de l'étoile. Le résultat suivant montre que 
l'on connaît parfaitement les variétés lorentziennes à symétrie sphérique à l'endroit 
où la courbure de Ricci est nulle, ce qui correspond, puisque la constante A = 0, 
à la région sans fluide de l'espace-temps. Plus précisément, on a alors le théorème 
suivant (voir [Haw73] p. 369-372) dont la preuve est due à Birkhoff : 

THÉORÈME V.83. Une variété lorentzienne à symétrie sphérique et à courbure 
de Ricci nulle est toujours localement isométrique soit à l'espace de Minkowski 
(i.e. l'espace de la relativité restreinte) soit à une variété lorentzienne (fl,g c ) où 

- Q = uj x S 2 avec 

u := {(x,y) G R 2 \x 2 -y 2 < 1} 

et S 2 est la sphère standard 

- pour tous (p, q) G eu x S 2 , 

* = c2 (swW 1 + R2(p)k ) 

où 

- h est la métrique hyperbolique standard sur u C M 2 donnée par h = —dx 2 + 
dy 2 ; 

- k est la métrique standard de S 2 ; 

- c est une constante strictement positive ; 

- pour tous p = (x,y) G u C M. 2 , R(p) > est définie implicitement par 

(R(p) - l)e R{p) =y 2 - x 2 . 

On peut vérifier que la courbure de Ricci de la métrique g c est bien nulle. Par 
contre, la norme de la courbure de Riemann tend vers l'infini lorsqu'on se rap- 
proche du bord de fl, c'est-à-dire de R = 0, ce qui montre que fl ne peut pas se 
prolonger (on dit que Q est inextensible) . 

On écrit maintenant 

UJ = 0J\ U u[ U u>2 U uj' 2 

où 

W\ := {(x, y) G ui\y > |x| 2 } et w[ = —Wi, 
ui2 = {(x,y) G u\y > |x| 2 } et w[ = —w±. 
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On définit aussi fij = Wj x S* 2 et fi ■ = Ui x S 2 

Di := {(x,y) e u\x 



Notons enfin 



y}*s 2 




y} x s 2 . 




Espace 



Figure 1. L'espace de Schwarshild 



Di et D 2 sont des hypersurfaces de type temps (i.e. la direction orthogonale est 
de type espace. Voir l'appendice). Elles séparent les domaines fi^ et fi^ 

Définition. 

- (Q 1 ,g c ) est appelé V espace de Schwarschild; 

- (fi 2 ,g c ) est appelé un trou noir; 

- (Q' 2 ,g c ) est appelé un trou blanc. 

Remarque V.84. Le domaine fi' x est isométrique à fii. Nous limiterons donc 
notre étude à fii. De même, le domaine fi' 2 es t isométrique à fi 2 . Par contre, 
leur orientation en temps est opposée, ce qui leur donne des propriétés physiques 
différentes. 

Nous allons étudier en détail chacun de ces domaines. Avant de passer à une étude 
plus détaillée, expliquons rapidement vers où nous nous dirigeons. D'abord, nous 
verrons que l'espace de Schwarschild est un domaine statique, c'est-à-dire un do- 
maine dans lequel nos intuitions ont un sens. Au contraire les trous blancs et les 
trous noirs sont des endroits où les lois physiques sont très différentes du monde 
qui nous entoure. On verra que la lumière ne peut pas s'échapper d'un trou noir 
alors qu'on contraire, un trou blanc ne laisse entrer aucune lumière. Physiquement, 
on n'a jamais réussi à prouver l'existence de trous blancs. 

Pour avoir une bonne image en tête, il faut imaginer les choses de la manière sui- 
vante : plaçons-nous du point de vue d'un observateur galiléen (qui existe puisque 
le domaine est statique) situé à grande distance de l'étoile, dans la partie "espace 
de Schwarschild". Alors, 
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Figure 2. Étoile à densité faible : pas de trou noir 

(1) Si l'étoile n'est pas suffisamment dense, elle occupe "plus de place" et 
son complémentaire se retrouve complètement dans la partie espace de 
Schwarschild. Cette situation est représentée sur la Figure El Le trou noir 
est "caché" à l'intérieur de l'étoile. En fait, ce n'est pas tout à fait vrai, 
puisqu'à l'intérieur de l'étoile, la métrique n'est plus de Schwarschild. Mais 
l'idée est qu'elle est trop grosse pour que le trou noir apparaisse. 




Bord du trou noir 



Kliiiic l'ildinlriV en l nui noir 



FIGURE 3. Étoile à densité forte : formation d'un trou noir 



(2) Si l'étoile est dense, toute la matière est confinée dans la partie trou noir : 
il y a effondrement gravitationnel. Cette situation est représentée sur la 
Figure [3J 

Comme on le verra plus loin, cette visualisation de la situation a ses limites. 



2. L'espace de Schwarschild 

2.1. Remarques importantes. Tout part de la constatation suivante : défi- 
nissons sur 

:= Mx]c,+oo[x5 2 
la métrique g' c définie en (t, r, q) G Q! par 

g' c = - (l - -) dt 2 + -^- c dr 2 + r 2 k (V.85) 

r 

où l'on rappelle que k est la métrique standard sur S 2 . Alors, 
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Proposition V.86. L'application 

(fli = wixs 2 )9c ) (n',^) 

est une isométrie. 

Ce résultat est évident à démontrer mais il a plusieurs conséquences intéressantes. 
D'abord, pour préciser les choses, il faut voir Q' comme txl 3 \ -8(0, c) où l'on 
a pris les coordonnées polaires sur R 3 dans une métrique un peu différente de la 
métrique euclidienne (elle est asymptotiquement plate : quand r — > 00, on retrouve 
la métrique euclidienne en coordonnées polaires). Évidemment, t est la variable de 
temps. La variable r est une distance radiale par rapport au bord de l'étoile. En 
fait, r ne représente pas la distance mesurée dans R 3 . En effet, la distance mesurée 
entre (t,r 1 ,q) et (t,r 2 ,q) est 

r2 dr 

! v^T 

En parlant de distance mesurée dans R 3 , on emploie un langage de mécanique 
classique ce qui est justifié au regard de la remarque suivante : définissons la 
métrique g c sur }c,+oo[xS 2 

g c (r) := c dr 2 + r 2 k. 



Définissons aussi la fonction f c := yjl — Le système de coordonnées (t,r,q) est 
une carte sur fli dans laquelle la métrique g c prend la forme g' c , c'est-à-dire que 
dans cette carte, g c = —f 2 dt 2 +g c . D'autre part, t est constante sur les sous-variétés 

{{x,y) G u)i\x = by} x S 2 

et les courbes t — > (t, r, q) pour r et g fixés sont représentés dans Qi par 

{(x,y) E uxly 2 - x 2 = a} x {q} 

où a est la constante (R — l)e R = (- — l) ei 

2.2. Un point sur la situation. Il découle de la Proposition IV.861 que l'es- 
pace de Schwarschild est un domaine statique dont les observateurs galiléens sont 
donnés par les courbes 

{(x, y) G coi\y 2 — x 2 = a} x {m} 

où a > (si a g] — I,0[, la courbe se trouve dans la région de trou noir) et où 
m E S 2 est fixé. L'espace vu par ces observateurs sont les sous-variétés 

{(x,y) G = by} x S 2 

où b g] — 1, 1[. La situation est représentée sur la Figure [H 

Rappelons qu'un domaine statique est un ouvert connexe Q' de Ai tel que (Q', g') 
est isométrique à (J xu',g) on I est un intervalle ouvert, u' est un ouvert connexe 
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de R 3 et où dans la "carte canonique" (donnée par l'isométrie de Q' dans I x eu'), 
la matrice de g' au point (t,x l ,x 2 ,x 3 ) £/xw' est donnée par 

/ -f 2 {x\x 2 ,x 3 ) \ 

gn^x 1 , x 2 , x 3 ) g 12 {x l , x 2 , x 3 ) g^x 1 , x 2 , x 3 ) 

#21 (V, x 2 , x 3 ) g 2 2{x l , x 2 , x 3 ) (fety , x 2 , x 3 ) 

y ^(a; 1 ,^ 2 ,^ 3 ) ^(x 1 ,^ 2 ,^ 3 ) ^(x 1 ,^ 2 ,^ 3 ) y 

où /, (jij : w' -> 1 (i G {1, 2, 3}) sont des fonctions. Rappelons également que Haw- 
king a montré que l'existence d'un tel domaine statique est équivalent à l'existence 
d'un champ de Killing K (c'est-à-dire un champ de vecteurs engendrant un flot 
isométrique) et d'une hypersurface H de genre espace orthogonale en tout point au 
champ de vecteurs K. Le flot de K donne un groupe à un paramètre d'isométries 
dont les orbites (c'est-à-dire les courbes intégrales de K) sont ^-orthogonales à H. 
Les courbes intégrales de K donnent des observateurs privilégiés que nous appel- 
lerons observateurs galiléens. Si D est un tel observateur, l'espace vu par D est à 
tout instant isométrique à (H, g) où g est la restriction de g' à H. 

Remarque V.87. 

(1) Cette situation montre plusieurs choses. Supposons que notre étoile soit 
suffisamment dense pour qu'il existe une région de trou noir. Prenons un 
observateur galiléen. L'espace qu'il voit est le produit d'une sphère S 2 par 
une droite de la forme x = by avec b G] — 1, 1[. Par conséquent, aucun 
observateur galiléen ne voit le bord du trou noir (on l'appelle l' horizon) si 
l'on omet {(0,0)} x S 2 . Cela n'empêche pas un observateur non galiléen 
ou un photon d'entrer dans le trou noir par un autre endroit mais cela 
modifie un peu l'idée première que l'on peut avoir d'espace vu par un 
observateur qui n'a pas une interprétation physique claire. En particulier, 
cela montre les limites de la visualisation décrite plus haut et illustrée par 
les Figures 12] et El 

(2) La région de trou noir ressemble beaucoup, au niveau des équations qui 
la décrivent, à la région Q 1 si ce n'est que les coordonnées x et y ont 
été échangées. Permuter une variable de type temps (la variable x) et 
une variable de type espace (la variable y) confère à ces deux régions des 
propriétés physiques très différentes. Par exemble, dans f2 2 , les courbes 

{(x, y) G coi\y 2 — x 2 = a} x {m} 

où a g] — 1, 0[ sont de de type espace tandis que les courbes 

{(x,y) G Ui\y = bx} x {q} 

où b g] — 1, 1[ sont de type temps (voir la Figure [Q. 

On a vu en cherchant l'équation d'Einstein (voir paragraphe 14.21) que la fonction 
h définie par f — 1 + h (ici f c = 1 + h) représentait le potentiel de la mécanique 
newtonnienne. Dans le cas d'un objet sphérique de masse M en mécanique clas- 
sique, la fonction potentielle est donnée par Or ici, pour r grand - << 1 et 
f c (r) ~ 1 — £=■ Autrement dit 
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La constante c > de g c s'interprète comme 2M où M est la masse de 
l'objet considéré. 

2.3. Géodésiques de l'espace de Schwarschild. D'après l'axiomatique de 
la relativité générale, les géodésiques de genre temps vont décrire le mouvement 
des particules autour de l'objet considéré (il faut supposer que ces particules sont 
suffisamment légères pour ne pas influencer le système) . Les calculs les plus simples 
sont obtenus en utilisant les coordonnées sphériques sur S* 2 . Dans ces coordonnées 
(t, r, 0, $), la métrique g c (ou g' c ) s'écrit 



Soit (t(s), r(s), ©(s), <&(s)) une courbe C 1 de genre temps. On montre le résultat 
suivant. 

PROPOSITION V.88. On suppose que l'objet considéré est de masse M (i.e. 
d'après le paragraphe précédent, c = 2M). Alors, pour tous ci, c<i, les solutions du 
systèmes suivants sont des géodésiques de genre temps : 



où les ' désignent la dérivée par rapport à la variable s. Les autres géodésiques sont 
obtenues par action du groupe G. 

Cette démonstration est évidemment calculatoire mais est très longue si on s'y 
prend mal. Il faut utiliser le fait que certaines quantités restent constantes le long 
des géodésiques. On ne la fait pas ici. 

Comparaison avec les lois de Kepler : Puisque l'espace de Schwarschild est 
statique, les observateurs galiléens voient toujours le même espace. En se plaçant 
de leur point de vue, on peut travailler dans un espace fixe à trois dimensions et 
comparer la situation à celle de la mécanique classique, décrite par les lois de Kepler 
qui modélisent le mouvement des étoiles. Fixons un observateur galiléen D. Vu par 
D l'espace-temps s'identifie à M x l 3 où l 3 est muni du produit scalaire euclidien. 
On utilise dans M 3 les coordonnées sphériques habituelles (r, O, <3>) et on considère 
un objet sphérique de masse M centré en 0. La fonction potentiel à l'extérieur 
de l'objet est donnée par —M/r. Considérons maintenant une particule dont la 
masse est suffisamment faible pour ne pas influencer le système (on suppose que 
le centre de l'objet de masse M considéré reste sur D). Notons (r(s), O(s), $(s)) 
la trajectoire de la particule. Les lois de Newton permettent d'écrire que 




r 
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où cq, ci, C2 G R sont des constantes. L'étude des trajectoires de ce système montre 
que les solutions sont des coniques de foyer 0. On remarque que ces équations 
sont assez proches de celles obtenues dans la Proposition IV. 881 Cependant, cette 
différence rend les équations relativistes beaucoup plus difficiles à étudier. On 
montre que les trajectoires bornées d'une particule (dans l'espace vu par les obser- 
vateurs galiléens) dans fli sont "presque" des ellipses fixes mais ne sont plus des 
courbes fermées. En fait, elles se comportent comme des ellipses dont l'axe tour- 
nerait légèrement à chaque rotation. Cette différence est faible mais malgré tout 
mesurable physiquement. Cela a été fait pour la planète Mercure : son périhélie (le 
point de son orbite le plus proche du soleil) se déplace à chaque révolution comme 
prédit par la théorie, confirmant ainsi la réalité physique du modèle relativiste. 

Géodésiques isotropes : De la même manière, on calcule les trajectoires des pilo- 
tons en regardant les géodésiques de type lumière. A l'infini, elles ont un compor- 
tement de droites. On calcule avec ces équations l'angle exact a entre la trajectoire 
rectiligne limite quand s — > — oo et celle obtenue quand t — > +oo. Cette déviation 
a été vérifiée expérimentalement : lors d'une éclipse de Soleil, Einstein avait prédit 
l'existence de mirages gravitationnels. Plus précisément, il pensait qu'on pourrait 
à cette occasion voir des étoiles se trouvant derrière le soleil, mais dont les rayons 
lumineux auraient été déviés comme le disent les équations ci-dessus. L'expérience 
a confirmé cette prédiction, donnant une preuve de plus de la validité du modèle 
de la relativité générale. 

Pour finir, on remarquera que si on calcule avec les lois de la mécanique classique 
l'angle a' de déviation obtenu non plus pour un photon mais pour une particule 
de masse non nulle voyageant à la vitesse de la lumière, alors on trouve une grosse 
différence entre a et a'. 



3. Trous noirs et trous blancs 

On se place sur le domaine fl 2 - On rappelle que le domaine Q' 2 (le trou blanc) 
est isométrique à f2 2 mais qu'il a une orientation en temps opposée (via cette 
isométrie). La première chose que l'on pourrait montrer est que ce domaine Sl 2 
n'est pas statique. Autrement dit, les lois qui y existent sont éloignées de celles de 
la physique classique. En particulier, il n'existe aucun obsevateur qui voit le même 
espace à tout instant. On va mettre en évidence deux propriétés importantes des 
trous noirs et propres à ce type de domaines. 

Propriété 1 : Tout observateur de Q 2 a une durée de vie finie. 



Propriété 2 : Aucun photon ne peut sortir de Q 2 (d'où la terminologie de "trou 
noir" ) . 

Pour démontrer ces deux propriétés, nous allons travailler dans les coordonnées 
(x, y, O, <3>) où (x, y) sont les coordonnées canoniques de u 2 et où (O, $) sont les 
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coordonnées sphériques sur S 2 . Dans ces coordonnées, la métrique g c s'écrit : 

g c = c 2 ( -^(-dx 2 + dy 2 ) + R 2 (dB 2 + sin(6) W 
\Re H 

où l'on rappelle que R est définie implicitement par (R — l)e R = y 2 — x 2 . 

Preuve de la propriété 1 : Précisons un peu la propriété 1. On va en fait montrer 

Propriété 1' : Une courbe de genre temps 7(5) = (x(s),y(s), O(s), paramétrée 
par son temps propre et dans l'orientation (i.e. ||7'(s)|| gc = —1 et j'(s) orientée 
positivement) est toujours telle que R(s) := R( r y(s)) est strictement décroissante. 
Supposons de plus que 7 est définie en 0. Alors, il existe T G]0,7rM] (on rappelle 
que c = 2M), telle que lim s ^ T R(s) = 0. 

Il faut remarquer que R(s) tend vers revient à dire que x(s) 2 — y(s) 2 tend vers 
1 dans Q et donc que j(s) tend vers le bord du domaine Q. Comme on l'a déjà 
expliqué, le bord de Q est une singularité au sens où la norme du tenseur de Rie- 
mann y est infinie. Passons à la preuve proprement dite. 

Puisque 7 est orientée positivement, x' > 0. D'autre part, on a 

-1 = gtf, 7') = |^W) 2 - [x'Y) + c 2 R 2 {{Q'f + sin 2 (0)($') 2 ). 
Puisque c 2 R 2 ((&) 2 + sin 2 (e)($ / ) 2 ) > 0, on obtient 

m 2 < wr -g 

et donc 



\y'\<\iW-j^- (V.89) 

D'autre part, par définition de R, (R — l)e R = y 2 — x 2 , c'est-à-dire 

\y\ = ^x 2 - (1 - R)e R . (V.90) 

En dérivant (R — l)e R = y 2 — x 2 par rapport à s, on obtient Re R R' = 2(yy' x x'). 
En utilisant les relations flV.89j) et flV.90j) . cela donne 



Re R R' < 2 ( ^x 2 - (1 - R)e R J {x') 2 - ^ - xx' ) . (V.91) 



Posons a = y/(l - R)e R , b = ^f- et 

f(x) = 2 (V^-aVM 2 -^ - xx') 
pour x > a. Pour tout x' > fixé, l'étude de la fonction / montre que 

f(x) < f (—) = -2ba = - e -^J(l-R)R. 
\ a J c 



76 



V. ÉTOILES ET TROUS NOIRS À SYMÉTRIE SPHÉRIQUE 



ce qui, en revenant à (1V.91j) montre que 



On en déduit que R' < et donc que R est strictement décroissante. 



(V.92) 



On peut sans restreindre la généralité supposer que 7 est définie en et à t = 
est stritement à l'intérieur de Q 2 (i-e. -R(O) < 1). On atteint une singularité dès 
que R tend vers 0. Soit T > en lequel 7 est définie. Puisque R est strictement 
décroissante, R(t) < R(0) < 1 pour tout t G [0,T]. Autrement dit, la courbe ne 
sort pas de f2 2 . Par ailleurs puisque R est décroissante 




cV R(0) 



Ainsi R atteient en un temps fini. Pour avoir une borne explicite de ce temps, 
on procède de la manière suivante : R étant strictement décroissante, elle établit 
une bijection de [0,T] sur [R(T),R(0)]. Notons S sa bijection réciproque. On a 
S'(r) = R /^s(r)) c ' es t-à-dire d'après (IV. 92p . 

S'(r)> , [_ 

r(s{t)) 1 y ; - 1 

Or, puisque R(0), R(T) e]0, 1[ (0 < R < 1 sur fi 2 ) 

T = S{R{T)) - S(R{0)) 

-R(T) 

S'{u)du 

R(0) 

S'{u)du 

R(T) 

- 1 c 
< / — . du. 

,/TTT 



En posant R = sin 2 u, on obtient T < |c ce qui implique la courbe 7 atteint la 
singularité en un temps fini. Cela termine la preuve de la Propriété 1. 



Preuve de la propriété 2 : La méthode est exactement la même sauf que 
cette fois, c(s) est de genre lumière. Autrement dit, on a g(c'(s),c'(s)) = ce 
qui conduit avec le même calcul à \y'\ < x' (on n'a pas défini la notion d'être 
orienté positivement pour une courbe de genre lumière mais la manière de le faire 
est évidente et conduit encore à x' > 0. La relation ( 1V.90P reste vraie, mais on 
aura simplement besoin du fait que \y\ < x (on notera que sur fï 2 , on a x > 0) . 
De ces deux relations, on tire 

Re R R' = 2(yy' - xx) < 

ce qui implique que R' < 0. 



4. À L'INTÉRIEUR DE L'ÉTOILE 
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4. À l'intérieur de l'étoile 

On suppose toujours qu'on a une symétrie sphérique en espace mais par contre, 
on suppose maintenant que l'on est en présence d'un fluide et donc que le tenseur 
d'énergie-impulsion n'est plus nul. Il faut prendre garde au fait que, à l'intérieur 
d'une étoile, on ne peut plus faire l'hypothèse que la pression est nulle. Par contre, 
on va négliger l'influence de tout champ électromagnétique. On est cette fois en 
présence d'un fluide parfait avec pression (c'est-à-dire correspondant à un tenseur 
d'énergie-impulsion de type II avec les notations du Paragraphe [5] du Chapitre 
IHip . dont on rappelle la définition : 

Définition. Un fluide parfait est la donnée d'un fluide (p, u) et d'une fonction 
p : Ai — > R caractérisant la pression. Le tenseur d'énergie-impulsion d'un fluide 
parfait est défini par 

t = p~Ù, g) u + p(g + u (g) lî). 

La forme que prend le tenseur d'énergie-impulsion d'un fluide parfait ne sera pas 
justifiée ici. On montre QWa84| p. 125-135 ou |Haw73j p372) : 

THÉORÈME V.93. Un domaine statique d'une variété lorentzienne à symétrie 
sphérique en espace, contenant un fluide parfait, est localement isométrique à 
(Q, G) où 

VI = Rx]0,+oo[xS 2 

et où pour (t, r, q) G Vt, 

G = -e 2 ^dt 2 + l -^rdr 2 + r 2 k 



avec 



et 



„ = (p(r) +p(r))(m(r) + 4?rp(r)r 3 ) 
r(r — 2m(r)) 

f R r 
m(r) = 47T / p{u)u 2 du < - (V.95) 
Jo 2 

m(r) + 4?rr 3 p(r) 
* (r) = r(r-H)) • (V - 96) 
Ici, p' et ip' désignent les dérivées de p et tp par rapport à r. 

Si l'on connaît la pression p en fonction de la densité de masse p, alors les équations 
différentielles (1V.94|) et (1V.95j) déterminent p et m (et donc p) en fonction de r. 



Puis (1V.96P permet de déterminer p. Pour déterminer ces fonctions, on se sert 
du fait qu'il existe r > tel que pour r > r , on est dans la partie sans fluide 
(Schwarschild ou trou noir) ce qui donne des conditions au bord et permet de 
résoudre ces équations. 
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Si les équations (IV. 941) et (1V.95j) ne sont pas résolubles avec m(r) < r/2, cela 
signifie que l'espace-temps représentant l'étoile n'est pas statique et que l'étoile 
évolue avec le temps. L'étude est alors beaucoup plus compliquée. Regardons, 
lorsque le théorème s'applique, le cas particulier d'un fluide incompressible, ce 
qu'on traduit par le fait que la densité de masse est constante à l'intérieur de 
l'étoile i.e. p = p pour r < r et p = si r > r (donc p n'est pas continue, ce qui 
implique que m est dérivable mais pas C 1 ). Les équations (IV. 940 . (lV.95j) et (1V.96|) 
se résolvent assez facilement et on trouve 



Ici c = 2M où M est la masse de l'étoile. En particulier, la pression au centre de 
l'étoile est 





Cela signifie en particulier qu'une étoile (dont le fluide est incompressible) ne peut 



être stable que si 3yl — ^ — 1 > c'est-à-dire si r > |M. On pourrait en fait 
montrer un résultat similaire pour des fluides compressibles. 



CHAPITRE VI 



Problème de Cauchy en relativité générale 

Ce chapitre s'intéresse à la notion de prédictibilité en relativité générale. Dans 
quelle mesure un observateur peut-il prédire l'avenir ou au contraire déduire le 
passé en connaissant le présent ? D'un point de vue mathématique, le problème se 
traduit facilement : soit S une surface de type espace (sur laquelle il faudra tout de 
même mettre plusieurs hypothèses) qui peut s'interpréter comme l'espace vu par 
un observateur à un instant donné et sur laquelle la métrique est connue (c'est-à- 
dire que l'on a une description complète du présent de cet observateur). Existe- il un 
unique espace-temps dans lequel S se plonge de manière isométrique? L'existence 
(dont il faut préciser le sens) dit simplement que le présent est réaliste. L'unicité 
(dont il faudra là aussi préciser le sens) par contre est bien plus intéressante : 
elle dit que le présent détermine complètement le futur et le passé. Outre cet 
aspect, ce chapitre présente la formulation de la relativité générale par conditions 
initiales. C'est un point de vue fréquemment adopté par les livres et qu'il faut 
connaître. Par ailleurs, cette démarche nous conduira à un problème mathématique 
d'analyse activement étudié à l'heure actuelle : les équations de contraintes dont 
nous donnons ici une résolution partielle. 

1. Structure causale de l'espace-temps 

Comme expliqué ci-dessus, le but de ce chapitre est d'étudier dans quelle mesure 
le présent détermine le futur et le passé. Pour cela, il convient de se placer dans 
un espace-temps réaliste et de faire quelques hypothèses. 

1.1. Hypothèses de causalité. Pour arriver au but ci-dessus, il faut fixer 
un cadre de travail réaliste. En particulier, les deux premières idées qui viennent 
à l'esprit sont les suivantes : 

(1) Les notions de "passé" et "futur" doivent être bien définies. C'est une 
hypothèse que l'on a déjà faite qui se traduit mathématiquement par 
l'orientabilité en temps. Remarquons qu'elle implique l'existence globale 
d'un champ de vecteurs t de type temps dans l'orientation (il suffit de 
le construire localement et d'utiliser la paracompacité de M). 

(2) On va supposer aussi qu'il n'y a pas de courbes fermées de type temps 
pour qu'un observateur ne puisse pas revivre éternellement les mêmes 
événements. Quand au contraire, il existe de telles courbes, on parle de 
violation de la causalité. 

Un exemple mathématique où il y a violation de la causalité est M := S 1 x M 3 
muni de la métrique plate de Minkowski. Cependant, cette hypothèse n'est pas 
suffisante : on peut construire des exemples d'espaces-temps (A4, g) pour lesquels la 
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causalité n'est pas violée mais qui possèdent des courbes fermées qui sont "presque" 
de type temps : plus précisément il existe une suite de métriques (g n ) n qui tend 
vers g et telle que pour tout n, la causalité est violée sur (Ai,g n ). Pour éviter ce 
genre de situation, Il semble que la bonne hypothèse soit : 

Définition. On dit que l'espace-temps (Ai, g) est causalement stable s'il existe un 
champ de vecteurs t de type temps tel que la causalité n'est pas violée sur (Ai, g) 
où la métrique g est définie par 

g := g — d t <8> d t , 

d~t étant la 1-forme canoniquement associée à ~t. 

L'idée ici est de construire une métrique g dont le cône de lumière en chaque point 
(c'est-à-dire les vecteurs de type lumière ou temps) est strictement plus gros que 
celui de g. Si maintenant une courbe fermée est presque de type temps pour g, 
elle sera de type temps pour g ce qui contredira l'hypothèse ci-dessus. On peut 
montrer de manière rigoureuse (voir [Haw73] section 6.4) que : 

THÉORÈME VI. 97. L 'espace-temps (Ai, g) est causalement stable si et seulement 
si il existe une fonction f : Ai — > M différentiable dont le gradient est en tout point 
de type temps. 

Ce résultat dit que l'hypothèse de causalité stable a de "bonnes conséquences" : 
en particulier elle implique l'hypothèse de causalité forte qui dit que pour tout 
p G Ai, il existe un voisinage V de p tel que toute courbe de type temps intersecte 
V au plus une seule fois. Pour le montrer, il suffit de voir que la fonction / est 
strictement croissante le long de toute courbe de type temps. Ainsi si une courbe 
7 de type temps est telle que 7j = p G Ai. Pour tout e > 0, on peut choisir un 
voisinage V £ de p tel que sur V £ , on a 

/(7(*o)-e)</</(7(*o)-e)- 

On est alors assuré que pour t > t + e et t < t Q — e, la courbe 7 n'intersectera 
plus V e . 

1.2. Variétés lorentziennes globalement hyperboliques. Il est naturel 
d'étudier d'abord l'influence d'un événement sur l'espace-temps. En particulier, la 
vitesse de la lumière étant une barrière absolue, un événement a une influence sur 
une portion limité de l'espace-temps : celle qu'il peut atteindre sans dépasser cette 
vitesse. Il est donc naturel d'introduire les définitions suivantes : 

Définition. Soit S C Ai un ensemble. On définit : 

(1) Le futur chronologique (resp. passé chronologique) I + (S) (resp. I~(S)) de 
S est l'ensemble des points p tels qu'il existe une courbe 7 de type temps 
orientée positivement (resp. négativement) telle que 7(0) G S et 7(1) = p. 
Remarquons qu'avec cette définition, p G" ^(S). 

(2) Le futur causal (resp. passé causal) J + (S) (resp. J~(S)) est défini comme 
I + (S) (resp. I~(S)) à la différence que 7 peut aussi être de type lumière. 



1. STRUCTURE CAUSALE DE L'ESPACE-TEMPS 



SI 



Ces ensembles, dont nous donnons la définition parce qu'ils apparaissent fréquem- 
ment dans la littérature, sont les parties de l'espace-temps qui peuvent être in- 
fluencées par ce qui se passe dans S. Selon que l'on admet que les événements 
puissent se déplacer à la vitesse de la lumière ou non, on considérera J^iS) ou 
J ± (5'). Ces ensembles ont certaines propriétés topologiques qui ne nous intéresse- 
rons pas ici : pour l'objet de ce chapitre, c'est-à-dire le problème de prédictibilité, 
ce ne sont pas les bons ensembles à considérer. Imaginons que S soit l'espace vu 
par un observateur à un instant donné. On n'a alors aucune chance de prédire ce 
qui se passe sur I + (S) ou J + (S). On sait juste que ce qui se passe sur S influence 
ce qui ce passe sur ces deux ensembles mais ils peuvent aussi recevoir l'influence 
d'événements extérieurs à S. Pour le problème de prédictibilité, on s'intéresse 
plutôt au domaine de dépendance de S défini de la manière suivante : 

Définition. Le domaine de dépendance futur (resp. domaine de dépendance passé) 
D + (S) (resp. D~(S)) de S est l'ensemble des points p G A4 tels que toute courbe 
7 issue de p de type temps inextensible (qui n'admet pas de prolongement) vers le 
passé coupe S. 

En d'autres termes, D + (S) est l'ensemble des points qui ne dépendent que de S. 
En ce qui concerne la surface S dont on étudie l'indépendance, il est naturel de 
considérer qu'elle ne s'influence pas elle-même. Plus précisément, 

Définition. On dit qu'une surface S est achronale si pour tous q, p G S, p et q ne 
peuvent pas être joints par une courbe de type temps ou de manière équivalente, 

si/+(S)ns = 0. 

Pour en finir avec les définitions, on considère qu'un espace-temps réaliste possède 
la propriété suivante (voir le Paragraphe 12. 2j) : si £ est l'espace vu par un observa- 
teur à un instant donné, tout autre observateur croisera £ au cours de sa vie. On 
donne donc les définitions suivantes : 

Définition. Une surface S est une surface de Cauchy si elle est achronale et si son 
domaine de dépendance D + (S)UD~(S) est A4 tout entier. Une variété lorentzienne 
qui possède une surface de Cauchy est dite globalement hyperbolique. 

On peut montrer que les surfaces de Cauchy sont des hypersurfaces de classe C° 
de l'espace-temps. Mais c'est surtout le théorème suivant qui est très important : 
il décrit de manière précise la topologie des variétés globalement hyperboliques : 

THÉORÈME VI. 98. Soit (A4, g) un espace-temps globalement hyperbolique. Alors, 
(A4, g) est causalement stable. De plus, il existe une fonction globale f : A4 — > R 
dont les surfaces de niveau sont des surfaces de Cauchy homéomorphes deux à 
deux. En particulier, A4 est homéomorphe à un produit A4 = I x S où I est un 
intervalle et où S est une surface de Cauchy de (A4, g). 

Quelques mots sur la preuve : On commence par se donner une mesure quel- 
conque \i sur A4 telle que fi(A4) < +oo). On définit 



r( P ) = kj'(p)) , r(p) = KJ~(p)) et f(p) 



f + (p) 
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pour tout p 6 Ai. Clairement, /~ est strictement croissante le long des courbes de 
type temps car si 7 est une telle courbe et si t < t', on a J~(t) C J~(t'). Ainsi, /" 
a un gradient qui est partout de type temps, ce qui implique d'après le Théorème 
( 1VI.97|) que (Ai, g) est causalement stable. 



Soit maintenant 7 : 1 — y R ( I est un intervalle) une courbe de type temps inexten- 
sible. On va montrer que les courbes de niveau de / sont des surfaces de Cauchy. 
Pour cela, il suffit de vérifier que pour tout a G R+, il existe t telle f(j(t)) = a. Plus 
précisément, on va voir que lim < _ s>inf (/) f(^(t)) = et que ]im t _ >SU pm f(j(i)) = +00. 
D'abord, / est clairement croissante. Supposons que lim t _ 5 . inf ( / ) f(^(t)) = c > —00. 
La définition de / implique que Z := r\teiJ~(j(t)) 0- Prenons une suite (t n ) qui 
tend vers inf(J). On voit alors que j(t n ) a une limite dans Z ce qui implique que 
la courbe 7 possède un point de départ et contredit le fait qu'elle est inextensible. 



L'hyperbolicité globale dans cette démonstration sert à démontrer des points qui 
semblent intuivement vrais (par exemple que les fonctions /~, / + et / peuvent 
être considérées comme étant différentiables ou encore que la suite j(t n ) a une 
limite) mais dont la preuve est plus subtile qu'il n'y paraît. 

2. Formulation de la relativité générale par conditions initiales 

2.1. Formulation du problème. Soit (Ai, g) un espace-temps et S une hy- 
persurface de type espace. Supposons que la métrique g soit connue sur S. Alors, 
peut-on en déduire g sur tout Ai ? Autrement dit, le présent étant connu, peut-on 
en déduire le passé et l'avenir, et ce, de manière unique ? La première remarque 
est que pour avoir une chance que cela soit vrai, il faut que Ai tout entier ne 
dépende que de S, autrement dit, que _D + (£) PI Z?~(£) = Ai. Puisque S est de 
type espace, elle est achronale et comme son domaine de dépendance est Ai tout 
entier, l'espace-temps (Ai, g) est globalement hyperbolique. En particulier, d'après 
le Théorème IVI.98[ Ai est homéomorphe à I x S où I est un intervalle. Quitte à 
faire une translation en temps, S s'identifie à {0} x S. L'idée est de voir g t = g/{t}xn 
comme une quantité sur une variété fixée S et qui évolue dans le temps. 



Il y a un problème avec cette manière de procéder : g t est définie sur TAi/{ t }xj:- 
Or il n'y a pas de manière canonique d'identifier ces espaces tangents pour deux 
valeurs de t différentes. L'idée est alors de travailler avec h t que l'on définit comme 
la restriction de g t à l'espace tangent de T({t} x S) (qui s'identifie de manière 
canonique à TE) et K t , la deuxième fondamentale de {t} x E dans (Ai, g). 

Définition. On dira qu'un triplet (£, ho, Kq) est une condition initiale pour la 
relativité générale si S est une variété de dimension 3, si ho est une métrique 
riemannienne sur S et si Kq est un 2-tenseur symétrique sur S. 

Le problème se reformule alors de la manière suivante : 



Formulation 1 (provisoire) : On considère la condition initiale (S, Hq, K ). La 
métrique g (définie sur {t} x S par h t et K t ) est-elle entièrement déterminée sur 
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A4 si on suppose que <7/t({o}x£) — ho et que la deuxième forme fondamentale de 
{0} x E dans (M, g) est K ? 



Pour obtenir une forme quelconque d'unicité, il faut supposer que l'espace-temps 
(A4, g) est le plus grand possible, condition sans laquelle tout domaine de (Ai, g) 
contenant E répond à la question. On va donc reformuler le problème de la manière 
suivante : 



Formulation 2 (provisoire) : On considère une condition initiale (E, ho, Ko)- 
Existe-t-il un espace-temps (A4, g) maximal unique (le sens sera précisé plus loin), 
g vérifiant l'équation d'Einstein, tel que (E, ho) se plonge isométriquement dans 
(A4, g) avec seconde forme fondamentale K 7 



La question ci-dessus n'a de sens que si l'on précise ce que l'on impose sur le 
tenseur d'énergie-impulsion. Dans cette discussion, on va se limiter aux espaces- 
temps vides. On impose la nullité du tenseur d'énergie-impulsion. Alors, on déduit 
de l'équation d'Einstein que : 



Rh + (t r h (Ko)) ~ \Kq \ho = 0- (contrainte des moments) (VI. 99) 

et 

V*Kij — V jtr ho (K ) = (contrainte hamiltonnienne) (VI. 100) 

Ces contraintes proviennent de la formulation hamiltonnienne de la relativité 
générale mais peuvent aussi se déduire des équations de Gauss et Codazzi (voir la 
Remarque IVII.139j) En particulier, il faut donc encore une fois changer la formu- 
lation du problème : 

Formulation finale On considère une condition initiale (E, ho, Ko) telle que les 
équations flVI.99j) et flVI.lOOl) soient satisfaites. Existe-t-il un espace-temps (A4, g) 
maximal (le sens sera précisé plus loin), g vérifiant l'équation d'Einstein, tel que 
(E, /i ) se plonge isométriquement dans (A4, g) avec seconde forme fondamentale 
Kol 



Le théorème suivant montre qu'un tel espace-temps existe : 

THÉORÈME VI.lOl. On considère la condition initiale (E, ho, Ko) où E est une 

variété de dimension 3, ho une métrique riemannienne et Ko est un 2-tenseur 
symétrique sur E tels que les équations (IVI.99P et flVI.lOOp soient satisfaites. Alors 
il existe un espace-temps (A4, g) orienté et un plongement O : E — > A4 qui 
vérifient : 

(1) (A4, g) est à courbure de Ricci nulle i.e. l'équation d'Einstein du vide est 
vérifiée ; 

(2) ©(E) est une surface de Cauchy de (A4, g) (qui par conséquent est globa- 
lement hyperbolique ) ; 

(3) Q*g = ho et la seconde forme fondamentale du plongement ©(E) est égale 
à Ko ; 
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(4) si {Ai' -, g') et O' : E — > Ai' sont respectivement un autre espace-temps et 
un plongement qui satisfont les conditions ci-dessus, alors alors (Ai', g') 
se plonge isométriquement dans (Ai, g) et via ce plongement, les images 
de E par O et 0' sont confondues. 

Un théorème similaire existe lorsqu'on ne suppose plus que le tenseur d'énergie- 
impulsion est nul. Ces résultats sont dus à Choquet-Bruhat |FB~52 ] et à Choquet- 
Bruhat-Geroch |CBG69] . 

Définition. L'espace-temps donné par le théorème ci-dessus s'appelle le dévelop- 
pement de Cauchy maximal associé aux conditions initiales (S, ho, K Q ). 

2.2. La conjecture de la censure cosmique (version forte). Le Théorème 
IVI.101I ne résout pas complètement le problème de prédictibilité qui consiste à 
savoir si le présent détermine entièrement le passé et le futur. En effet, étant 
données des conditions initiales (E, ho, Ko), le développement de Cauchy maximal 
(Ai, g) associé est unique mais rien ne dit que ce développement n'est pas plongé 
isométriquement dans un espace-temps plus grand (Ai', g'). Le domaine Ai' \ Ai 
n'est pas a priori déterminé par le présent. Penrose a conjecturé que l'hypothèse 
suivante est vraie : 

Conjecture de la censure cosmisque (version forte) : Dans un espace-temps 
raisonnable, le présent détermine complètement le passé et l'avenir. Autrement dit, 
tout espace-temps raisonnable est globalement hyperbolique. Une troisième manière 
de le dire est que tout développement de Cauchy maximal est inextensible (c'est-à- 
dire qu'il ne se plonge pas isométriquement dans un espace-temps plus grand). 

Nous verrons dans le Chapitre IVIIII une version faible de la conjecture de la censure 
cosmique qui, malgré la terminologie, est indépendante de celle-ci. 

Compte-tenu du Théorème f lVI.lOip . à chaque fois que l'on est capable de construire 
une condition initiale (E, h, K) vérifiant les équations de contraintes (1VI.99P et 
( IVI.lOOp . on obtient une solution de l'équation d'Einstein du vide. Dans cette sec- 
tion, on montre comment construire de telles conditions initiales. On arrive alors 
à un problème purement mathématique. Les paragraphes qui suivent présentent 
cet aspect. 

3. La méthode conforme 

Cette méthode a été développée par Choquet-Bruhat, Lichnerowicz et York. Fixons 
une variété E de dimension 3 et cherchons h' et K' vérifiant les équations de 
contraintes (1VI.99|) et (IVI.lOOp . Le problème est sous-déterminé ce qui va nous 
permettre de faire des choix simplifiant considérablement les équations. En parti- 
culier, à la place de chercher la métrique h' dans l'ensemble de toutes les métriques 
riemanniennes sur E, on va la chercher dans une classe conforme. On fixe donc une 
métrique riemannienne h sur E et on cherche h' de la forme h' := (p^h où (p : E — > K. 



3. LA MÉTHODE CONFORME 

est régulière, strictement positive. 
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Écrivons K' = \rb! + a' où r = tr/ l (a) représente la courbure moyenne du plon- 
geaient de S dans (Ai, g) que l'on obtiendra grâce au Théorème (IVI.101I) et où a' 
est la partie sans trace de K'. L'équation (IVI.100I) devient alors 

(V)^- jj(vv = o (VI. 102) 

où V est la connexion de Levi-Civita de la métrique h'. 

Définissons a" par a" = ip 2 a'. On calcule que 

<^- 6 VVy - -V,-r = (VI. 103) 

o 

où cette fois, V est la connexion de Levi-Civita de la métrique h. On va encore 
faire une simplification : on va supposer que a" s'écrit a" = a + LW. Ici, a est un 
2-tenseur symétrique à trace et divergence nulles (ce type de tenseur s'appelle un 
TT-tenseur), W est une 1-forme et l'opérateur L est défini par 

LW = + VjWi - lv k W k hij. 

L'opérateur L s'appelle V opérateur de Killing conforme. Son noyau est composé 
des 1-formes dont le champ de vecteurs associé est un champ cpnforme. Rap- 
pelons qu'un champ de vecteurs est conforme si son flot fournit une famille de 
difféomorphismes conformes. On peut vérifier que le dual de L est la divergence 
relative k h ce qui implique qu'avec ces notations, l'équation flVI.103p devient 

L*LW = \ip*dr. (VI. 104) 

3 

Il est important de noter que l'opérateur L*L est elliptique. 

On regarde maintenant l'équation (1VI.99I) que l'on transforme grâce à la formule 
de changement conforme de la courbure scalaire (II V. 771) (appliquée cette fois pour 
une métrique riemannienne) : 

= R hl -\K'\ h , + {tr h ,{K')) 2 
= (p- 5 (8A h $ + R hV ) - ir 2 - + r 2 

= <p- 5 (8A h $ + R h (p) - l -r 2 - \LW + a\ 2 h ip- 12 + r 2 

En multipliant cette équation par ip 5 , on obtient l' équation de Lichnerowicz : 

2 

8A h <p + R h <f = -g-rV + \ L W + <r\l<p~ 7 . 

Cette équation avec l'équation (IVI.104j) sont appelées les équations de contraintes 
conformes. 
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En résumé : soient h une métrique riemannienne sur S, r une fonction, a un 
2-tenseur symétrique sans trace et à divergence nulle. Si on trouve une fonction 
strictement positive <p et une 1-forme W solutions de 

2 

8A h ip + R h ip = --tV + \LW + a\ 2 h <p- 7 

2 d (VI.105) 
L*LW = -ip 6 dr, 

alors (£, (f% \r^h + <^" 2 (a + LW)) est une condition initiale pour la relativité 
générale vérifiant les équations de contraintes (1VI.99j) et (IVI.lOOj) . On obtient ainsi 
une solution de l'équation d'Einstein dans le vide. 



4. Une méthode de résolution des équations de contrainte conformes 

Nous présentons en version très simplifiée une méthode développée par M. Dahl, 
R. Gicquaud et l'auteur [DGH10] lorsque la variété S est compacte. D'autres 
méthodes existent, par exemple celles de |BI04] . de |IQM04j ou de |M08] (la liste 
n'est pas exhaustive) mais la méthode proposée ici a l'avantage de requérir des hy- 
pothèses plus explicites que les autres. Dans le cas non compact, citons aussi les jo- 
lis résultats de Gicquaud |Gi09j et Gicquaud-Sakovich [GS10J et dans le cas où le 
tenseur d'énergie-impulsion n'est plus nul, ceux de Druet, Hebey [DH09J. Dans ce 
dernier cas, les équations de contraintes conformes ont un terme supplémentaire qui 
rend leur résolution beaucoup plus difficile. Il peut alors être naturel de découpler 
les équations et de n'étudier que l'équation de Lichnerowicz. Pour une telle ap- 
proche, on pourra par exemple se référer à Hebey, Pacard et Pollack [HPP08J. 



Peut-être n'est-il pas inutile de s'arrêter quelques instants sur la cohérence phy- 
sique de la compacité de S. Autrement dit, est-il plausible de penser que l'univers 
est compact ? La plupart des travaux de cosmologie prennent comme cadre un 
univers au contraire non compact. Malgré tout, la cas compact est parfois envi- 
sagé : par exemple, Jean-Pierre Luminet [LuOl] a travaillé dans cette direction. 
L'un des arguments qu'il utilise pour justifier son travail, outre l'intérêt scientifique 
de la démarche, est le suivant : supposons que l'univers est infini. Comme dans 
un volume donné, il existe un nombre de configurations de particules certes très 
grand, mais fini, cela signifie que chacune de ces configurations a une probabilité 
très grande (en fait, cette probabilité vaut 1) d'être répétée une infinité de fois. 
Autrement dit, dans le cadre d'un univers infini, il est très probable qu'il existe 
en ce moment quelqu'un qui vous ressemble trait pour trait et qui est en train de 
lire le même texte que vous. Même si ce raisonnement est approximatif sur bien 
des points, on peut se convaincre en s'y penchant un peu plus profondément, qu'il 
n'est pas si absurde qu'on pourrait le penser. Nous n'allons pas poursuivre plus 
loin cette discussion puisque la compacité éventuelle de l'univers n'est que pure 
spéculation, mais il faut avoir en tête qu'un univers fini reste de l'ordre du possible. 



Revenons donc à notre problème. D'après le paragraphe précédent, les données du 
problème sont, sur la variété S : 
- une métrique riemannienne h, 
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- un 2-tenseur a symétrique, à divergence et à trace nulle 

- une fonction régulière r, 
et on cherche à trouver 

- une fonction strictement positive (p, 

- une 1-forme W, 

qui satisfont les équations de contrainte conformes : 

2 



8A(p + Rip 
L*LW 



-rV + |<7 + lwtv 

o 



2,„-7 



(VI.106) 
(VI.107) 



Pour simplifier les notations, on a noté R la courbure scalaire de h et on ne précise 
pas la dépendance du laplacien A par rapport à h. On définit 

{k\LV? dv) 112 



C h :=mî 



ik\ndv) 



1/6 



(on note dv l'élément de volume de h) où l'infimum est à prendre sur tous les 
champs de vecteurs V sur a non identiquement nuls. Des estimées elliptiques stan- 
dard montrent que la constante Ch est strictement positive s'il n'existe aucun 
champ de Killing sur (E, h). On montre alors que 

THÉORÈME VI. 108. On suppose que t ne s'annule pas sur S que a ^ et que 

(£, h) ne possède aucun champ de Killing conforme. Alors, si 



dr 



< 



L3(S) 



2°*' 



le système d'équation f1VI.106j) — (IVI.107|) admet une solution (<p, W) où <p > 0. 

COROLLAIRE VI. 109. On suppose que t ne s'annule pas sur S, que R > et 

que (S, h) ne possède aucun champ de Killing. Alors, si 



dr 



< 



L3(S) 



2^' 



le système d'équations f]VI.106|) — (1VI. 107[) admet une solution (</?, W) où ip > si 
et seulement si a ^ 0. 

4.1. Démonstration du Théorème IVI.1081 Dans tout ce paragraphe, on 
suppose que r ne s'annule pas sur E et que a ^ 0. On suppose aussi que 



dr 



< 



L3(E) 



2 e * 



(VI.llO) 



On va montrer que le système ( 1VI. 106j) — (1VI.107[) admet alors un couple de solutions 
(ip, W) où <f > 0. La preuve se déroule en plusieurs étapes. D'abord, on peut vérifier 
l'invariance conforme du problème : l'existence de solutions dépend seulement de 
la classe conforme de h. D'après la solution du problème de Yamabe (voir par 
exemple |Aub98j ). on peut supposer que la courbure scalaire R est constante 
égale à —1, ou 1. 
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4.1.1. Le système sous- critique. L'idée d'étudier ce système a été suggérée par 
Jim Isenberg. Soit e > petit. On commence par étudier le système sous-critique 

8A<p e + Rp e = ~r 2 ^ + \a + LW £ \ 2 ^\ (VI.lll) 

L*LW e = -<ft~ £ dT. (VI.112) 
3 

Pour trouver des solutions à ce système, nous utilisons une méthode développée 
par Maxwell [M08J. Soit *p G L°°(£), (p > 0. D'après les Propositions 2 et 5 de 
[M08], il existe un couple unique (W, ip) où W E C l (E), ip G C 2 (S) qui satisfait 

SAip + Rip = --r 2 tfj 5 +\a + LW\ 2 tp- 7 , (VI.113) 
3 

L*LW = -^- e aÏT. (VI.114) 
3 

On définit 

N £ (<p) := ^ 

et on montre le résultat suivant : 

LEMME VI. 115. Il existe une constante a e > telle que pour tout b < a e , il 
existe une constante Kj, dépendant seulement de b, r, a et h mais pas de e telle 
que 

K b < N £ (ip) < a £ 

si (p est telle < (p < b. De plus, si R < 0, K b ne dépend pas non plus de b. 

Démonstration. Tous les ingrédients de la preuve sont dans la Proposition 
10 de Maxwell [M08j . même si l'auteur ne les présente pas sous cette forme. Pour 
montrer la Proposition IVI.119I ci-dessous, nous n'aurions besoin que de l'énoncé 
qui se trouve dans [M08] , mais le Lemme IVI.115I énoncé sous cette forme nous 
sera utile plus tard. 

L'argument est le suivant : soit ip une fonction strictement positive et soit W 
solution de l'Équation (IVI.114I) . On suppose que ©_ (resp. 0+) est une sous- 
solution (resp. une sur-solution) de l'Équation flVI.113j) avec ©_ < 0+. Alors 
O- < N £ ((p) < 6+. En effet, la Proposition 4 de Maxwell |M08j montre qu'il 
existe une solution O de l'Équation (1VI. 1 13[) qui satisfait 6_ < O < + . Par 
unicité de la solution de l'Équation (IVI. 113j) . on a 6 = N E (ip). Pour démontrer 
le Lemme IVI.1151 nous montrons que + := a £ est une sur-solution dès que a £ 
est assez grand et si < b < a £ est tel que p < b, alors, on peut trouver une 
sous-solution ©_ dont le minimum ks dépend seulement de b. 

Par la théorie elliptique standard, il existe une constante C qui dépend seulement 
de h telle que tout solution W de l'équation flVL114l) satisfait 

Il LW\\oo < ColIdrlUMfc 6 . (VI.116) 
Soit a £ > assez grand pour que 

Ra £ + ^r 2 a* - 2\\a\\ 2 a; 7 - 2C 2 \\dT\\ 2 0û a 5 £ - 2£ > 0. (VI.117) 
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Alors 0+ := a e est une sur-solution de l'équation (1VI.113j) . Occupons- nous main- 
tenant de trouver une sous-solution. 

Soit b < a e . Supposons que (p < b. 

Cas 1R = 0ouR=1. Comme dans la Proposition 10 de [M08J, on considère 
la solution rj de 

8Ar] + (R + \t 2 )ï] = \a + LW\ 2 . (VI.118) 

Puisque R + |r 2 est positive ou nulle mais pas identiquement nulle, une telle 
solution existe et est strictement positive. On pose r\ a = ar], a étant une constante 
strictement positive. On voit que 

2 2 
8A7] a + Rr] a + -T 2 r]l -\<t + LW\ 2 r)- 7 = -t 2 («V -arj) + \a + LW\ 2 {ar] - a~ 7 r}~ 7 ). 

Si a est assez petit, plus précisément, plus petit qu'une constante dépendant seule- 
ment de max(ry), alors 

8Aï? a + Rr) a + 2 -T 2 r]l - \a + LW\ 2 r]- 7 < 0. 

Ainsi 0_ := arj est une sous-solution de l'équation (1VI. 1 13[) . On fixe maintenant 
a telle que cette inégalité soit satisfaite. Nous avons déjà remarqué que a peut 
être choisi de manière à ce qu'il ne dépende que de max^), ce qui fait que la 
constante Kb dépend seulement de max(?7) et de min(r/). Maintenant, comme dans 
la Proposition 11 de Maxwell [M08], on a 

min(^) > C I \a\ 2 dv 
Jt, 

et 

max(??) < C'b 12 - 2£ < C'm&x{b 12 , 1) 
où C, C dépendent seulement de g et r. Cela termine la preuve dans ce cas. 

Cas 2 R = — 1. D'après la solution du problème de la courbure scalaire prescrite 
(qui est résolu dans ce cas : voir [Aub98j), il existe une fonction positive rj telle 
que la métrique h := rfh soit à courbure scalaire R^ = — |r 2 . Alors, 

2 

8Arj + Rrj = — r 2 rf 
3 

ce qui implique que ©_ := rj est une sous-solution. Il faut remarquer que dans ce 
cas, Kb = min ©_ ne dépend pas de b. Cela termine la preuve du Lemme IVI.115I 

□ 



On est maintenant en mesure de trouver des solutions du système sous-critique. 

PROPOSITION VI. 119. L'application N £ possède un point fixe. Autrement dit, 
il existe une solution régulière (ip E ,W e ), <p £ > 0, du système flVI.ll lj) — (ÎVI. 112D . 
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Démonstration. Comme dans la Section 4.2 de [M08J on définit U = {<p e 
L°°(M) : K ae < ip < a £ }. Dans l'expression ci-dessus, K ae est la constante donnée 
par le Lemme IVI.115I appliqué avec b = a £ . En reproduisant mot pour mot les 
preuves de la Section 4.2 de |M08j . on trouve un point fixe pour N £ in U, c'est- 
à-dire un couple (<p £ ,W £ ), <p £ > 0, solution du système (1VI. 1 (IVI. 1 12[) . Les 
résultats de régularité montrent que (p £ et W £ sont régulières. □ 



4.2. Convergence des solutions sous-critiques. Pour tout e > 0, on note 
((p £ , W £ ), ip £ > la solution régulière du système (IVI. 1 1 1[) (IVI. 1 12[) donné par la 
Proposition IVI.1T91 On définit 

1/3 

Te := ( / \LW £ \ 2 dv 
et on montre le lemme suivant 

LEMME VI. 120. Supposons que la suite (7 e ) E soit bornée quand e — y 0. Alors, il 
existe une solution régulière (<p, W), (p>0, du système flVI.106p -f lVI.107p . 

DÉMONSTRATION. Soit u £ := cpj. On multiplie l'équation (IVI.llip par Lp 7 E et 
on intègre sur S. Cela donne 

- f \du £ \ 2 dv+ [ Ru 2 £ dv + \ [ T 2 u\dv= [ \a\ 2 dv + [ \LW £ \ 2 dv. (VI.121) 

On a utilisé que 



a + LW £ \ 2 dv= / \a\ 2 dv+ / \LW £ \ 2 dv 



qui provient du fait que a est à divergence nulle. Puisque (j £ ) £ est bornée et puisque 
L*L n'a pas de noyau, la suite (W £ ) £ est bornée dans W l,2 (T>) (l'espace de Sobolev 
des fonctions L 2 dont les dérivées au sens des distributions sont aussi dans L 2 ). 
Par réflexivité de W /1,2 (S), il existe W G W 1,2 (S) telle qu'une sous-suite de (W £ ) £ 
(pour laquelle nous gardons la même notation) converge vers W faiblement dans 
W /1 ' 2 (S). Supposons R > 0, alors, d'après flV1.12ip . on voit que {u £ ) £ est elle aussi 
bornée dans W l,2 ÇE). On obtient le même résultat dans la cas où R = —1, (u £ ) £ . 
En effet, supposons que ||w E || e tendent vers +oo (après l'extraction possible d'une 
sous-suite). Nous obtenons par f lVI.12ip que 

lim / u 2 dv = +oo (VI. 122) 



(sinon, l'équation (IVI. 121|) implique que J E \du £ \ 2 dv est bornée et donc il est en de 
même de ||w £ || £ ). Avec l'équation f lVI.12ip et l'inégalité de Holder, on obtient que 

- / uldv < — - [ r 2 ul dv 

3 mm t 2 



C f 2 , 

< — ï / u £ dv 

mmr z J s 

mmr 2 \J S 
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Cela entraîne que (f„uldv) , et ainsi (J„u 2 dv) doit être borné ce qui contredit 

fivi.mp . 

On vient de montrer que la suite {u £ ) £ est bornée dans W /1 ' 2 (S) et donc dans -£/ 6 (£) 
par le Théorème de Sobolev. Notons que 

L*LW £ = u 3 £ /2 - £/4 dr. (VI. 123) 

On déduit des estimées elliptiques standard que {W £ ) e tend vers W dans H^ 2 ' 4 (E) 
et donc dans C 1 (S). Nous évaluons maintenant l'équation (TVI.111I) en un point 



x £ G M où ip £ atteint son maximum m £ := ma.x((p £ ). Cela donne 

2 

-r 2 m\ + Rm £ <\a + LW £ \ 2 m £ 7 , 
o 

car Aip £ (x £ ) > 0. Puisque (W £ ) £ est borné dans C 1 (E) et puisque r n'a pas de zéro 
sur S, on obtient que {m £ ) £ est bornée. Soit m un majorant de {m £ ) £ . On applique 
le Lemme IVI.115I avec b = m ce qui montre que ip £ = N £ ({p £ ) > K b > pour 
tout e > 0. Il s'ensuit que la suite (8A(p e + Rf £ ) £ est bornée dans L°°(E). Par des 
arguments standard d'ellipticité, il existe une fonction régulière <p > K b > telle 
qu'une sous-suite de ((p £ ) £ tende vers ip in C 2 (E). On obtient aussi que W £ — > W 
dans C 2 (E). En passant à la limite dans les équations (lVI.lllj) - (IVI.112j) . on voit 



que ((/?, W) est une solution du système (1VI.106I) - (1VI.107[) . Cela prouve le Lemme 
IV1.120I □ 



On termine la preuve du Théorème IVI.108I en montrant 

LEMME VI. 124. Sous l'hypothèse (1VI.110I) . la suite ('y £ ) £ est bornée. 

Démonstration. Supposons qu'au contraire, % — > oo quand e — > (quitte 
à extraire une sous-suite). Si R > 0, l'équation (lVI.12ip nous donne 

\ [ T 2 u 3 £ dv< [ \a\ 2 dv + ^ = 7e 3 (l + o(l)), (VI.125) 

où o(l) — >■ quand e — > 0. Si R = —1, on déduit de l'équation (lVI.12ip et l'inégalité 
de Holder que 

2 - J r 2 u\ dv < 7e 3 (l + o(l)) + J u 2 dv 

< 7e 3 (l + o(l)) + C (^J u s £ dvj dv 

2 

<7 £ 3 (l + o(l)) + L7^y r 2 ^ 3 ^ 3 rfî; 
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ce qui implique encore une fois l'équation f lVI.125j) . On multiplie l'équation ( 1VI.112j) 
par W £ et on intègre sur E. Cela donne 



il 



LW £ \ 2 dv 
(u £ f 2 - £ ^(dr,W £ }dv 

(r 2/3 M£) 3/2- £ /4 (r -l +e /6 dT; w ^ dv 



fi ^ 4 + £ 

— / . .... -12- \ -JT y „ v 1/6 



s 

On a utilisé l'inégalité de Holder ainsi que le fait que ^Ë 6 ^ < 1 qui provient de 
7 e — > oo. D'après ( 1VI. 125j) et puisque 

\l/6 / /■ \l/2 3 

W £ \ 6 dvj <C h l [J\LW £ \ 2 dv\ =C^iî, 
on obtient 

4+e 



6-e / 12 
4+e 



12 



3 V2 7 U s v^ e/6 

Puisque ^J 6 ^ < 1, ce qui provient de 7 e -» oo, cela contredit ( IVI.llOp quand 
s -> 0. □ 



5. Preuve du Corollaire IVI.109I 

Nous donnons des résultats qui étendent ceux du Théorème 2 de |IOM04f . On 
suppose ici que la courbure scalaire R est positive sur S. 

En vertu du Théorème IVI.1081 il suffit de supposer que a = et de montrer 
que le système (IVI. 106j) (IVI. 107|) n'admet aucune solution. On le démontre par 
l'absurde : supposons que (IVI. 106|) (IVI. 107|) admette une solution régulière (</?, W) 
avec <f > 0. Remarquons que 

/ cpAcp 7 dv = — I \dip 4 \ 2 dv. 
Jt 16 Jt 

Ainsi, en posant u = (p 4 , en multipliant (IVI. 106|) par ip 7 et en intégrant sur S, on 
obtient que 

- / \du\ 2 dv+ [ Ru 2 dv + \ [ r 2 u 3 dv= [ \LW\ 2 dv, (VI.126) 
2 Jt Jt 3 y E y s 

puisque o = 0. Comme R > cela donne 

~ / r 2 u 3 dv< [ \LW\ 2 dv. (VI.127) 
3 Jt Jt 
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Maintenant, on multiplie (1VI.107|) par W et on intègre sur E. En utilisant l'inégalité 
de Holder, 

2 



\LWrdv 



2 

< - 

~ 3 



u 3/2 (dr, W) dv 
t'^vP dv 



\dr\ 



T 



1/3 



dv 



\W\ 6 dv 



1/6 



D'après (1VI. 127|) et la définition de Ch, on obtient que 

(k\LW?dv) 112 



C h < 



, 2 y/2 


dr 








T 



($^\W\ G dv) 1,& W ' L3(S) 

puisque, de manière évidente W ^ 0. Cela termine la démonstration du Corollaire 
IVI.1091 



CHAPITRE VII 



Les systèmes isolés 

Les systèmes isolés jouent un rôle très important en cosmologie. Dès que l'on veut 
étudier un système solaire, une planète et ses satellites ou une galaxie, on néglige 
l'influence des astres lointains et on est confronté à un système isolé. L'une des 
particularités de tels systèmes est que, dans certaines situations, on peut définir 
de manière cohérente leur énergie et leur impulsion, ce qui est impossible en toute 
généralité. 

Cette étude nous amènera tout naturellement à plusieurs problèmes purement 
mathématiques : le problème de la masse positive et du moment-énergie positif. 

1. Diagramme de Carter-Penrose 

Un système isolé est un système physique confiné dans une portion bornée d'es- 
pace. Même si l'image que l'on peut avoir en tête est claire, il n'est pas si facile 
d'en trouver un modèle cohérent. L'idée directrice est la suivante : plaçons-nous 
du point de vue d'un observateur D dans l'espace-temps (A4, g) de la relativité 
générale et supposons qu'à tout instant t, l'espace vu par D est une hypersurface 
Si non compacte de type espace. Toute la matière est confinée dans un domaine 
compact K de E t ce qui se traduit par le fait que le tenseur d'énergie-impulsion 
est à support compact. Il est bien évidemment plausible de penser que plus on 
s'éloigne de K, moins l'influence du système se fera sentir, autrement dit, plus la 
métrique va avoir tendance à devenir plate. On va donc imposer que la limite de 
g à l'infini soit la métrique de Minkowski 77 := — dt 2 + (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 . Il 
faut prendre garde au fait que l'on a supposé ici que la constante cosmologique A 
de l'équation d'Einstein était nulle (rappelons que la constante cosmologique n'in- 
fluence que les propriétés globales de l'espace-temps). Si on l'avait supposée non 
nulle, les conditions à l'infini auraient été différentes (par exemple, asymptotique- 
ment hyperbolique). D'un point de vue riemannien, notons g% la restriction de g à 
l'espace tangent TH t . C'est une métrique riemannienne qui à l'infini tend vers la 
métrique euclidienne de M 3 . On dit que E t est asymptotiquement plate ou asympto- 
tiquement euclidienne. On donnera une définition plus précise de ces notions plus 
loin. En fait, de manière plus générale, la plupart des situations peuvent s'étudier 
avec cette seule condition de platitude asymptotique, c'est-à-dire sans supposer 
que le tenseur d'énergie-impulsion est nul à l'infini (il est seulement asymptotique- 
ment nul). 

Regardons ces définitions d'un peu plus près : on a envie de décrire un système 
isolé par un tenseur d'énergie-impulsion à support compact sur les espaces vus par 
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un observateur et de dire qu'en l'infini spatial, la métrique est asymptotiquement 
plate (au sens lorentzien, c'est-à-dire qu'elle tend vers la métrique de Minkowski) . 
Malheureusement, ces notions ne sont pas bien claires. Qu'appelle-t-on "infini spa- 
tial" ? Il dépend évidemment de l'observateur. Peut-on tout de même en donner 
une définition globale ? Supposons malgré tout qu'une telle définition soit trouvée 
et soit cohérente. La notion de "limite en l'infini spatial" est-elle bien claire? Sur 
quel espace vivent les objets limites ainsi obtenus ? 

Pour résoudre ces difficultés, une façon naturelle de procéder est de dire que (Ai, g) 
est asymptotiquement plate s'il existe un système de coordonnées (t, x 1 , x 2 , x 3 ) 
dans lesquelles la limite de g^ est rjij (rj est la métrique de Minkowsi) quand 
r 2 := (a; 1 ) 2 + (x 2 ) 2 + (x 3 ) 2 tend vers +00 dans une direction spatiale ou isotrope. 
Dans de nombreux problèmes mathématiques (y compris ceux de la masse posi- 
tive ou du moment-énergie positif présentés à la fin de ce chapitre), on simplifie 
ces considérations au maximum : on se fixe une hypersurface S de type espace à 
l'infini de laquelle la métrique g est plate. Dans certaines situations, la définition 
ci-dessus sera suffisante (à condition de la préciser bien sûr) mais dans d'autres, 
elle posera un véritable problème parce qu'il faudra vérifier que les objets supposés 
intrinsèques que l'on étudie ne dépendent pas du choix de ces coordonnées. 

Nous expliquons maintenant comment obtenir une définition adaptée à toutes les 
situations : il s'agit du diagramme de Carter-Penrose qui consiste à compactifier 
la variété afin de définir correctement toutes les notions d'infinis dont nous avons 
besoin. Cette procédure est plus compliquée que la définition ci-dessus et ne sera 
utilisée que dans les cas où elle s'avère indispensable (par exemple dans le Chapitre 
IVIIII) . Dans les problèmes mathématiques présentés à la fin du chapitre, nous n'en 
aurons pas l'utilité. 

Pour comprendre cette définition, plaçons d'abord dans l'espace de Minkowski 
(M 4 ,?7 = —dt 2 + (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 ). Pour bien comprendre ce qui se passe, 
il faut considérer l'espace de Minkowski comme une variété lorentzienne muni de 
la métrique plate plutôt que comme un espace affine. Il y a bien sûr une manière 
naturelle de définir l'infini spatial et les limites correspondantes en utilisant les 
coordonnées canoniques de M 4 . Mais nous allons utiliser un autre moyen qui nous 
amènera à une définition de platitude asymptotique dans le cadre de la relativité 
générale. Pour cela, on va travailler en coordonnées sphériques (t,r, 0, $) dans 
lesquelles la métrique r] s'écrit 

-dt 2 + dr 2 + r 2 (d& 2 + sin 2 (e)d$ 2 ) . 

Notons T le sous-domaine de R x § 3 défini en coordonnées sphériques (T, R, O, $) 
par 

-vr < T + < vr et - n <T - R <n. 

Attention : (R, 0, $) sont bien les coordonnées sphériques sur § 3 . En particulier, 
< R < il. La Figure [T] représente T dans les coordonnées (T,R). 

Alors, le point-clé est le suivant : 
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Figure 1. Diagramme de Carter- Penrose pour l'espace de Minkowski 

PROPOSITION VII. 128. Notons g can la métrique canonique sur R x S 3 . L'ap- 
plication 

(M 4 , t?) ->■ (T,g can )) 
(t, r, G, $) i— ?■ (arctan(t + r) + arctan(t — r), 

arctan(t + r) — arctan(t — r), 0, $) 

(où /'on a pris les coordonnées sphériques à la fois sur IR 4 et sur T) est un 
difféomorphisme conforme de facteur conforme 

4 



F : 



Q : = 



(l + (t + r) 2 )(l + (t-r) 2 )' 



Démonstration. Une autre façon de présenter les choses est de dire qu'on 
effectue le changement de coordonnées (T := arctan(t + r) + arctan(t — r),R := 
arctan(t + r) — arctan(t — r), G, <E>). En considérant (T, i?, G, $) comme des coor- 
données sphériques sur R x S 3 , on vérifie facilement que R 4 est envoyé sur T. Par 
ailleurs, on voit que dans ces coordonnées, on a 

V = -L (_ rfT 2 + dR 2 + sin 2 (Q) + sin 2 (e)rf$ 2^ J _ 

Or dans les coordonnées sphériques, la métrique canonique de M x S 3 a la forme 
suivante : 



o can = -dT 2 + dR 2 + sin 2 (Q) (dQ 2 + sin 2 (G)d<ï> 2 ) 
ce qui prouve que fl 2 F*i] = g can . 



□ 



Revenons maintenant à notre problème de définir correctement 1"' infini spatial" 
indépendamment des coordonnées. Soit D un observateur quelconque qui à l'ins- 
tant t voit l'espace S. S est un hyperplan de type espace de (M 4 , 77). Écrivons 
S = p^] x + P où !Î est un vecteur unitaire de type temps orienté positivement 
et P est un point de M 4 que l'on peut sans restreindre la généralité supposer être 
l'origine. "Aller à l'infini dans S" correspond à faire tendre r vers +00 tout en 
restant dans S. Prenons donc une suite de points X n = (t n , x\ , x 2 , x\ ) de S (en 
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coordonnées canoniques sur M 4 ) qui tend vers l'infini, c'est-à-dire tel que la suite 
r 2 := (x*) 2 + (x 2 ) 2 + (xfj 2 tende vers l'infini. Alors, on montre que 

PROPOSITION VII. 129. Les coordonnées sphériques {T n , Rn, 9 n , $ n ) de F(X n ) 
dans T sont telles que \im n R n = n et lim n T!„ = 0. 

Démonstration. Notons (t v , x\, x 2 , x 3 ) les coordonnées (canoniques) de lï 
dans M 4 et posons r 2 = (x*) 2 + (x 2 ) 2 + (x 3 ,) 2 . Puisque I n eE = [v]" 1 , on a 

= i](X n , v) = -tt v + x\x\ + x 2 x 2 + x\x\ < -t n t v + r n r v . 

et donc 

r n > c v t n (VII. 130) 

où c v = j- (rappelons que t v > car v est orienté positivement). Par ailleurs, 
0>— 1 = i](v,v) = —t 2 + r 2 ce qui implique que c v > 1. On obtient que lim n (t„ + 
r n ) = +oo et que lim n (t„ — r n ) = — oo d'où la proposition. □ 

Cette proposition permet de donner un sens précis à l'infini spatial : il est matérialisé 
par le point io G T CG M x S 3 de coordonnées T = et R = n et qui est représenté 
sur la Figure [TJ II faut bien remarquer que R = n en coordonnées sphériques sur 
S 3 correspond bien à un point unique tandis que R — a G]0,7r[ correspond à une 
sphère de dimension 2. On dira donc qu' 

une suite de points tend vers l'infini spatial si et seulement si elle tend vers io dans 

T. 

Du fait que la métrique g can de M x S 3 est bien définie sur i Q , on peut donner un 
sens à la limite de certaines quantités de l'espace de Minkowski obtenue en passant 
à la limite vers l'infini spatial. C'est l'un des intérêts majeurs de cette approche. 

Remarque VII. 131. 

(1) De la même manière, V infini temporel futur (resp. infini temporel passé ) 
est matérialisé dans Y par le point i + (resp. z_ correspondant à R = et 
T = 7r (resp. T = — ir). Il correspond à la limite dans le futur (resp. le 
passé) de toute géodésique de type temps. 

(2) Toujours de la même manière, on définit un infini futur de type lumière 
et infini passé de type lumière matérialisés respectivement dans T par 

J + := {(T,i2,e,$) Gf|T + J R = 7r; J R>0} 

et 

J- := {(T,i?,0,$) G r|T — R = — 7r; i? > j 

qui correspondent aux limites des suites de points qui tendent vers l'infini 
avec une direction de type "lumière". 
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Revenons maintenant général d'une variété lorentzienne (Ai, g). L'idée 

est de dire que (M., g) est asymptotiquement plate si une construction similaire 
peut être faite. Avant d'être plus précis, nous avons besoin de rappeler quelques 
définitions vues dans le Chapitre |VÏ] : soit (N, G) un espace-temps et p G N un 
point. Le futur (resp. passé) causal de p est l'ensemble J + {p) (resp. J~((p)) des 
points x G N tels qu'il existe une courbe de genre temps ou lumière orientée posi- 
tivement (resp. négativement) joignant p à x. Nous dirons aussi que la métrique G 
est C >0 en p si elle est continue en p et si toutes ses dérivées d'ordre 1 admettent 
des limites directionnelles en p qui dépendent de manière lisse de la direction. On 
peut maintenant donner la définition suivante : 

Définition. On dit que (Ai, g) est asymptotiquement plate à l'infini spatial s'il 
existe un espace-temps (Ai, g), un point i G M et un difféomorphisme conforme 
F : Ai — > F (Ai) C M de facteur conforme Q (i.e. tel que g = Q 2 F*g) qui 
vérifient : 



(3) la métrique g est C°° sauf éventuellement en i où elle n'est que C >0 . 

La condition (1) traduit à peu près le fait que îq est spatialement lié à 
tout point de Ai (en fait, on verra que ce n'est pas tout à fait vrai). La 
condition (2) traduit le fait que la métrique g est aymptotiquement plate 
et la condition (3) est une condition de régularité de g en i qui doit être 
suffisament générale pour couvrir les situations intéressantes mais pas trop 
restrictive non plus pour pouvoir travailler en Îq. 

Cette définition ne traduit que la notion d'espace-temps asymptotique- 
ment vide, c'est-à-dire de système "presque isolé". Quand on veut réellement 
parler de système isolé, on ajoute la condition suivante : 

(4) Il existe un voisinage N de %q dans Ai tel que sur Ai H N, g satisfait 
l'équation d'Einstein du vide. 

Remarque VII. 132. Le point z'q de cette définition est nécessairement unique. 

La terminologie souvent utilisée est de parler de quantité physique pour toute quan- 
tité relative à la métrique g et de quantité non physique (unphysical en anglais) 
pour toute quantité relative à la métrique g. 

A bien des égards, cette définition peut sembler insatisfaisante. Par exemple, on ne 
peut pas déduire de ces hypothèses que toute hypersurface de type espace rencontre 
l'infini spatial. Cependant, il faut remarquer que c'est aussi le cas dans l'espace de 
Minkowski. En effet, si on prend une hypersurface de type espace qui est asympto- 
tiquement de type lumière, alors, l'infini sera modélisé par un point de J + ou de 
J~ . Notons aussi que, contrairement à ce que disent certains livres, la condition 1 
n'implique pas que l'infini spatial est spatialement lié à tout point de F (Ai). Un 



(1) 
(2) 



J+(z )U J-(io) = M\M; 
fi(i ) = 0, V^(z'o) = et (V~ 9 ) 2 



(i )Q = g(i ) ; 
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contre-exemple simple est le domaine (M 4 \ S 3 ) U (J + (0) U J~(0)) de l'espace de 
Minkowski. L'origine n'est clairement pas liée spatialement à l'infini spatial. On 
s'est en effet arrangé pour que toute courbe qui joigne à l'infini spatial rencontre 
le cône de lumière (J + (0) U J~(0)) de 0. Pour finir, remarquons que malgré tout, 
la définition présentée couvre bien les situations simples qui nous intéressent (par 
exemple le cas des espaces-temps qui sont des produits M = M x 1). 

Avec le même modèle mais en changeant les conditions ci-dessus, on peut définir 
de même un espace-temps asymtotiquement plat à l'infini de type lumière. 

Pour finir, il convient d'expliquer un point qui peut paraître étonnant dans le choix 
d'un tel diagramme. En effet, l'infini spatial et l'infini temporel sont réduits à un 
point tandis que les infinis de type lumière sont beaucoup plus riches en ce sens 
qu'il sont représentés dans le diagramme par des segments. Il y a en fait une raison 
physique à cela. On verra dans le Chapitre IIXI que les ondes (les phénomènes décrits 
par l'équation des ondes) se propagent à la vitesse de la lumière. En particulier, 
l'énergie transportée par une onde jusqu'à l'infini va se retrouver dans l'infini de 
type lumière X + . C'est pourquoi on "éclate" cet infini en un segment afin de pouvoir 
y lire le maximum d'informations. C'est aussi la raison pour laquelle les théories 
dites de "scattering" ont pour but de contruire des opérateurs S : X - — >■ X + qui 
modélisent la transmission d'informations entre l'infini passé de type lumière et 
l'infini futur de type lumière. 

2. Masse ADM d'un système isolé 

Le but de section est d'expliquer comment apparaît naturellement la notion de 
masse ADM qui s'interprétera physiquement comme l'énergie totale d'un système 
isolé. 

2.1. Peut-on définir une énergie locale? Dans tout ce chapitre, on ne 
définit que des grandeurs totales (énergie totale, moment total). Essayons de com- 
prendre pourquoi. Tout au long de ce texte, on s'est appuyé sur la loi physique 
suivante : l'énergie totale d'un système physique est constante dans le temps, 
indépendemment des événements qui se produisent dans ce système. Peut-on don- 
ner en relativité générale une définition de la notion d'énergie (relative à un obser- 
vateur) qui soit conforme à la loi ci-dessus ? En toute généralité, on est confronté 
à un problème important : celui de l'énergie gravitationnelle. 

Précisons un peu les choses. D'abord, rappelons que l'énergie est la capacité d'un 
système à exercer un travail ou une action. L'une de ces formes d'énergie est 
l'énergie gravitationnelle. Elle est facilement mise en évidence lorsqu'on ouvre les 
vannes d'un barrage sur un lac. L'eau va s'écouler avec une force considérable : 
l'énergie gravitationnelle s'est transformée en énergie cinétique. Pour obtenir une 
grandeur "énergie d'un système physique" constante dans le temps, il faut nécessai- 
rement qu'elle tienne compte de cette énergie et pas seulement de l'énergie propre 
de la matière (électromagnétique, cinétique, masse,...). Le problème qui se pose en 
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relativité générale est que toutes les définitions que l'on peut trouver se déduisent 
du tenseur d'énergie- impulsion, qui ne rend compte que de l'énergie propre de la 
matière et absolument pas de l'énergie gravitationnelle. 

Pour comprendre où est la difficulté, considérons deux étoiles A et B et regardons 
la métrique à un endroit quelconque de l'espace. Sa déformation par rapport à la 
métrique plate traduit l'influence des deux étoiles sur l'espace-temps. Le problème 
qui se pose est le suivant : comment distinguer l'influence de l'étoile A de celle 
de l'étoile B ? Pour cela, il faudrait pouvoir construire une une fonction "densité 
d'énergie gravitationnelle" associée à chaque étoile, ce qu'on ne sait pas faire. 
Plusieurs raisons physiques (que nous ne détaillerons pas ici) font même suspecter 
qu'une telle construction est impossible. 

Sans densité d'énergie gravitationnelle, il semble impossible de définir l'énergie d'un 
système. En tout généralité, lorsqu'on étudie un système physique, on ne sera pas 
capable d'isoler son énergie de l'énergie gravitationnelle produite par la matière 
qui se trouve à l'extérieur de ce système. Ce problème n'en est plus un si l'on 
considère qu'on est en présence d'un système isolé. On ne pourra bien évidemment 
toujours pas définir de notion locale d'énergie mais on va être capable de définir 
une énergie totale. C'est l'objet des paragraphes suivants. 

Remarque VII. 133. La situation est radicalement différente de ce qui se passe 
en mécanique classique pour laquelle à chaque système est associé un potentiel 
newtonnien qui quantifie en chaque point l'influence exacte de chaque corps. 

2.2. Formulations lagrangiennes et hamiltonniennes de la relativité 
générale. La notion de masse ADM provient de la formulation hamiltonnienne 
de la relativité générale dans le cadre d'un système isolé. Dans ce paragraphe, nous 
expliquons en quoi consiste cette formulation. Avant cela, nous aurons besoin de 
parler de formulation lagrangienne. 

Ce paragraphe est un peu technique. Pour le lecteur pressé, l'idée est de supposer 
que l'espace-temps est de la forme M = M x I où / est un intervalle et que l'on 
est en présence d'un système isolé. La masse ADM est une quantité définie sur 
chaque M x {t} et conservée dans le temps. Cette propriété en fait un candidat 
naturel pour être interprétée comme une énergie, ce qui sera confirmé par d'autres 
moyens. 

2.2.1. Formulation lagrangienne de la relativité générale. De manière générale, 
plaçons- nous dans l'espace-temps (M, g) de la relativité générale et supposons 
que dans un cadre donné, nous cherchions à trouver un tenseur ip qui satisfait une 
certaine équation (E). La formulation lagrangienne du problème consiste à trouver 
une fonctionnelle appelée fonctionnelle d'action de la forme 

(où T est l'espace de tenseurs parmi lesquels on cherche ip) telle que ip satisfait 
l'équation (E) si et seulement si ip est un point critique de L. La métrique G est 
une métrique fixée sur Ai. Dans de nombreux cas, on peut prendre G = g mais 
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comme on le verra lorsqu'on voudra obtenir une formulation lagrangienne de la 
relativité, il vaut mieux parfois fixer une autre métrique. La fonction C s'appelle 
le lagrangien du problème. Ici, on l'a fait dépendre de if) et de ses dérivées mais 
on peut aussi admettre les dérivées d'ordre supérieur. Pour illustrer cet exemple, 
imaginons que l'on cherche à trouver une fonction if> G C°°(M) qui vérifie 

n g ip + m 2 ip = (E) 

où m est un réel fixé. De telles fonctions sont appelées champs de Klein-Gordon. 
Remarquons que, dans le cadre riemannien, (E) n'a pas de solution mise à part 
la fonction nulle. Alors, il est clair qu'une fonction ip G C°°(Ai) vérifie l'équation 
(E) si et seulement si elle est point critique de 

LkgW = [ \Vip\ 2 g + m 2 i> 2 dv g . 

J M 

Autrement dit, on fixe G = g et on pose 

W^V<A) = |V^ + mV. 

Dans le cadre de la relativité générale, le tenseur ip est la métrique elle-même et 
l'équation (E) est l'équation d'Einstein (111157p . La formulation lagrangienne du 
provient s'obtient par le calcul suivant : soit (g t ) t une famille de métriques telle 
go = g et ^ t=Q gt = h. Prenons un domaine borné f2 de Ai d'adhérence compacte. 
Un calcul que nous ne ferons pas ici (voir par exemple |LP87] ) donne 



d_ 

dtt=o 



/ Scal gt dv gt = / h k iEg l dv g + K(h)dv g 
Jn Jm JdU 



où E g est le tenseur d'Einstein de la métrique g et où K(h) est une quantité 
construite à partir de h et de ses dérivées. Si maintenant h est à support compact 
et si Q est suffisamment grand pour contenir le support de h alors le terme de bord 
disparaît dans l'expression ci-dessus. On voit alors que g vérifie l'équation d'Ein- 
stein du vide si et seulement g est un point critique de g' — > J M Scal g idv g i. Il faut 
remarquer que pour se ramener à la situation précédente, il est judicieux de fixer 
une métrique quelconque G sur Ai. On peut alors regarder la fonctionnelle d'action 

g —7- f M L(g, V<7, V 2 g)dvc où le lagrangien £ est donné par C(g) = Scal g ^= det ^ . 

De la même manière, on peut obtenir une formulation équivalente à l'équation 
d'Einstein en présence d'un fluide (par forcément parfait) à condition de modifier 
en conséquence le lagrangien. Nous n'expliquerons pas ici la manière de s'y prendre. 

2.2.2. Formulation hamiltonnienne de la relativité générale. La formulation ha- 
miltonnienne est assez proche de la formulation par conditions initiales de la rela- 
tivité générale présentée au Chapitre [VU L'idée pour le problème de Cauchy est de 
comprendre ce qui se passe dans le futur lorsque le présent est connu. La formula- 
tion hamiltonnienne est plus "mathématique" (et donc moins "physique") : on es- 
saye de construire des quantités dont la conservation dans le temps est équivalente 
aux équations d'Einstein. 
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Considérons que la variété M. possède un champ de vecteurs t qui vérifie V-^ t = 
ce qui signifie en gros que M. est feuilletée par des géodésiques de type temps. 
C'est l'hypothèse la plus couramment utilisée pour la formulation hamiltonnienne 
mais pour ce qu'on veut comprendre, on va simplifier la situation en faisant une 
hypothèse encore plus forte : on suppose que M. est un produit M x I (I est un 
intervalle) tel que pour tout t, M x {t} est une hypersurface de type espace. Notons 
Mt := M x {t}. On revient au problème de trouver un tenseur if> qui satisfait une 
certaine équation (E). L'idée ici est de poser i[) t = ip/M t et de regarder (ip t ) comme 
un flot hamiltonien, c'est-à-dire, en restant vague pour l'instant, de trouver une 
quantité qui dépend de ip t et qui est constante par rapport à t si et seulement si 
ip est solution de (E). 

Soyons un peu plus précis : on va chercher une fonctionnelle appelée hamiltonien 
dépendant d'inconnues n, q (qui sont en général des tenseurs) 



où G est une métrique fixée sur M (comme dans la formulation lagrangienne, il 
est souvent mieux de fixer une métrique différente de g/M t ), où "H est une fonction 
à valeurs réelles que l'on doit définir et qui s'appelle densité hamiltonnienne et où 
l'on a 



les dérivées notées ' étant à comprendre relativement à la variable de temps t. 

Avant d'expliquer à quoi correspondent exactement q et n dans notre problème, 
il est utile de donner quelques explications. En particulier, il nous faut donner un 
sens à ces équations. D'abord, il faut préciser à quels espaces appartiennent n et q : 
ce sont des tenseurs définis sur M t et tels que si q est un tenseur de variance (k, l) 
alors 7r est un tenseur de variance (l,k). Regardons maintenant l'expression 
Il faut évidemment la comprendre comme une différentielle partielle, c'est-à-dire 
une forme linéaire définie sur les tenseurs de variance (/, k). Or q' est un tenseur 
de variance (k,l) et peut être vu comme une forme linéaire sur les tenseurs de 
variance (/, k) en posant 



Il faut prendre garde au fait que dans la suite, la notation q' pourra avoir deux 
significations différentes : soit elle représentera la dérivée soit elle représentera 
sa "forme intégrale" définie par (1VII.135j) . Il en sera de même pour la notation tt'. 





(VII. 134) 




(VII.135) 



Pour l'instant, contentons-nous d'admettre que q et tt sont des quantités construites 
sur M t à partir du tenseur tp cherché et que l'on prend comme variables pour des 
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raisons que l'on explique ci-dessous. On peut donc considérer que H est une fonc- 
tionnelle en l'inconnue ip et par abus de notation, on peut écrire H = H(ir, q). 
Ce que l'on veut, c'est que les deux équations (1VH.134|) soient vérifiées si et seule- 
ment si ip satisfait l'équation (E). 



L : 



Expliquons maintenant ce que représentent les quantités n et q. Pour construire 
une telle fonctionnelle H, la seule méthode que nous connaissons est de s'appuyer 
sur une formulation lagrangienne du problème. Supposons que c'est le cas et que 
nous disposions d'une fonctionnelle d'action de la forme 

^ ~> J M £(ip,Vip)dv H 

où l'on a conservé les notations du paragraphe précédent mais où la métrique fixée 
sur Ai = M x / est la métrique H := G + dt 2 Posons 

dC 
dq r 

La quantité 7r ainsi définie s'appelle un moment. Alors, on obtient une formulation 
hamiltonnienne en posant 

n(ir,q) =7iq'-C(q). (VII.136) 

Notons que £ ne dépend que de la variable q (même si elle se calcule avec ses 
dérivées) : il faut bien distinguer la dérivée q' de q et la variable q'. Avec un tel 
choix, nous obtenons ce que nous cherchons. Plus précisément, 

PROPOSITION VII. 137. Le tenseur ip est un point critique de L si et seulement 
si les équations ( 1VII.134j) sont vérifiées. 

Démonstration. Commençons par supposer que ip est un point critique de 
L. Posons 



#(7r,<z) = if(V0= / n(7r,q)dv G . 

JM t 

q' ■ dv G 



Mt 



Alors, 

dH 

du 

car C ne dépend que de q. Par ailleurs, d'après flVII.135j) . la forme linéaire r\ — )■ 
Jm l'vdvG correspond exactement à ce que nous avons noté q' dans les équations 
flVII.1341) . On a donc 

dH _ , 

En intégrant par partie, on a aussi 



dH d r d r 

-â~ = — ôT / tî' qdvc - — / C{q)dv G 
dq dq J Mt dq J Mt 

d f 

= -n' - — / C{q)dv G . 
dq J M t 
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Puisque ip est un point critique de C sur tout domaine de l'espace-temps, on a 

£ f 2 / £(g)«fo G = 
pour tout t\ et É 2 - On en déduit facilement que J M( C(q)dvc = et donc que 

Réciproquement, supposons les équations (1VII.134j) vérifiées. Posons 

J($) = ! H{$)dt 
Jti 



ixq — C(ïjj)dvG ) dt 
h \JM t J 
ta / [■ \ f 

£(ijj)dv G 



/ nq'dvG ) dt — j 



(VII.138) 



t2 



nq'dvc ) dt — L(if)). 
ti \JM t J 

Pour simplifier les notations, on a oublié les dérivées de ip dans la notation C(ip). 
Considérons une famille ip a telle que S(ip a ) /m< = pour t — t\ et t — t2 où S désigne, 
comme dans toute la suite, l'expression ^ a=0 - Notons n a et q a les quantités n et q 
associées. Alors, en utilisant f lVII.f38j) 

àJtya)= [ ( [ {-Kaàq' a + {5-K a )q' a )dv G \dt-5L{^ a ). 

Jti \JM t J 

En intégrant par parties (par rapport à la variable t) et en utilisant les équations 
(IVII.134D . on obtient : 

ôJ(ip a ) = £ (^j {-7c' a ôq a + (ôir a )q' a ) dv<^j dt - ôL(ip a ) 

"* 2 / r d \ 

-f (H{iT a ,q a ))dv G ) dt - ôL(ip a ). 

M t "aa=0 / 

Revenons à la définition de J = J* t 2 Hdt. Remarquons que le premier terme du 
membre de droite est, par définition de H égal à SJ(ip a ). On obtient ainsi que 
SL(ip a ) = ce qui prouve que ipo es t un point critique de L a . Cela termine la 
preuve de la Proposition IVH.137I □ 



Remarquons qu'on n'a pas utilisé la forme explicite de ir dans cette démonstration. 
Sans être précis, n est définie pour pouvoir reconstituer ip à partir de q et n (il y 
a aussi d'autres raisons physiques que nous ne mentionnerons ici). 



Pour illustrer ces propos, regardons l'exemple des champs de Klein-Gordon étudiés 
au paragraphe précédent. On suppose, pour simplifier, que la métrique g est déjà 
de la forme g = G + dt 2 . On pose q = tp/Mt et 71 = 9C d K < G ■ ^ n on conserve la 
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notation tp à la place de q puisque les deux quantités sont les mêmes et puisqu'on 
cherche if). Rappelons que 

= ~0j') 2 + \V 9 t tfj\ 2 + m 2 q 2 

et donc n = —2ip'. On pose alors 

H KG = ^ ~ Ckg = -(vr 2 + | Wl 2 , + mV). 

On vérifie alors facilement qu'en posant (HxG)t = f M Hicg, les équations flVII.1341) 
sont équivalentes à la formulation variationnelle (c'est-à-dire lagrangienne) de 
l'équation de Klein-Gordon. 

Il se peut que le problème soit mal posé, par exemple que les variables soient mal 
choisies, dans un espace trop gros. On peut arriver ainsi à une densité hamilto- 
nienne (i.e. la fonction H) qui ne dépend pas de q' mais en général, en changeant 
de point de vue, on arrive à régler ces questions. Nous ne attarderons pas sur ces 
considérations ici. 

Puisque dans le paragraphe précédent, nous avons expliqué comment obtenir une 
formulation lagrangienne de la relativité générale (dans le vide), la méthode ci- 
dessus permet d'obtenir une formulation hamiltonnienne du problème. Il faut bien 
s'y prendre mais les calculs se font et on obtient explicitement les expressions de 
7r, "H en fonction de g, g t et la seconde forme fondamentale K de M t . Les équations 
( 1VII. 134)) sont explicites mais longues et nous ne les donnons pas ici. 

Remarque VII. 139. Par construction, la formulation hamiltonnienne de la re- 
lativité générale fournit des relations conservées avec le temps. On verra dans le 
prochain paragraphe que la masse ADM est en un exemple. D'autres exemples 
sont les équations de constraintes (jVL99p et flVI.lOOp rencontrées au Chapitre IVT1 

2.3. Masse ADM d'un système isolé. Dans ce paragraphe, nous définis- 
sons la masse ADM d'un système isolé. D'abord, arrêtons-nous un instant sur la 
terminologie de "masse". Rappelons qu'il y a de nombreuses formes d'énergies : 
la masse est l'une d'elles et la formule E = me 2 traduit cette relation. Dans le 
cas d'un fluide parfait sans pression au repos, ces deux notions sont confondues et 
souvent, dans la littérature, la terminologie utilisée prête à confusion : la masse 
ADM doit plutôt être pensée comme une énergie. En particulier, pour le célèbre 
problème de la masse positive présenté en fin de chapitre, on devrait plutôt parler 
d'énergie (d'ailleurs, certains, principalement les physiciens, le font). 

On suppose pour simplifier que M. = M x / où I est un intervalle et où, pour 
tout t, M t := M x {t} est une hypersurface de type espace. Puisqu'on étudie un 
système isolé, on va supposer que chaque M t est asymptotiquement plate : 
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Définition. Une hypersurface S de (Ai, g) est asymptotiquement plate, s'il existe 
un compact K et une carte 

E\K -> R 3 \B 

^ ' p h-> (x 1 , X 2 , X 3 ) 

où £> est la boule unité standard de M 3 , telle que, si on note g la restriction de la 
métrique g à l'espace tangent TE et h est la seconde forme fondamentale, alors, 
dans les coordonnées (x 1 , x 2 , x 3 ), g^ — > ôij et — > lorsque r 2 := (x 1 ) 2 + (x 2 ) 2 + 
(x 3 ) 2 tend vers l'infini. 

Il faudrait être plus précis sur la convergence (en fait, il faut avoir une conver- 
gence en norme C 2 ), sur la vitesse de convergence, et il faudrait être plus général 
sur la topologie de S qui, à un compact près, doit, d'après cette définition, être 
difféomorphe à 1R 3 \ B. Notre but pour l'instant étant simplement de comprendre 
certaines notions physiques, nous allons ici nous contenter de cette définition mais 
nous serons plus précis quand nous énoncerons les problèmes mathématiques en 
fin de chapitre. 



Revenons maintenant à la formulation hamiltonnienne de la relativité générale 
et supposons donnée une métrique g solution de l'équation d'Einstein. Puisqu'on 
est en présence d'un système isolé, on peut se placer en dehors de ce système 
et appliquer les résultats trouvés dans le paragraphe précédent qui concernent 
l'équation d'Einstein dans le vide : on construit ainsi le hamiltonien H ainsi que 
les quantités n et q de manière à ce que les équations (1VH.134|) soient vérifiées. 
Prenons une famille de métriques (g a ) telle que go = g et dont la variation en 
a = est à support compact. Notons q a et 7r a les quantités correspondantes. Les 
équations (1VII. 134|) disent que 



SH(g a ) = -Q^^a + -Q-à<la 

Dans le calcul du hamiltonien devraient apparaître des termes de bord mais nous 
les oublions en choisissant "H puisque, les variations de métriques étant à support 
compact, ces termes disparaissent en intégrant sur M t tout entier. Maintenant soit 
(g a) une famille de métriques que nous noterons cette fois (g t ) qui vérifie toujours 
que go = g mais telle que, cette fois, la variation n'est plus à support compact 
mais a la propriété de conserver la platitude asymptotique de chaque M t . Nous 
utiliserons la notation (gt)t pour la raison suivante : nous considérons plus loin une 
métrique g solution des équations d'Einstein sur M x I et qui est asymptiquement 
plate (i.e. chaque tranche est asymptotiquement plate). Nous regarderons alors la 
famille de métriques g t = g/Mx{t}- Puisque chaque tranche est asymptotiquement 
plate, cette variation de métriques conserve la platitude asymptotique. 

Dans ce cadre, les termes de bord ne s'annulent plus. Pour ce type de variations, 
on calcule (toute les expressions étant explicites, ce calcul est long mais direct) : 



6H(g t ) = q' t 5-K t - Tt' t 5q t - 6C t 
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où, dans les coordonnées (x 1 , x 2 , x 3 ) données par la platitude asymptotique de M t , 

C t = lim ^— [ (dj(g t )ii - di(g t )ij)v J dsç. 
R^oo Ibiï J Sr 

Dans cette expression, on a g t = g /tau- On a aussi noté Sr la sphère Sr = 
{(x 1 , x 2 , x 3 ) \r < R}) et ds^ l'élément de volume induit par £ := (dx 1 ) 2 + (dx 2 ) 2 + 
(dx 3 ) 2 sur S R . 

Cela nous conduit à définir un nouveau hamiltonien H en posant 

H = H + C t 

(qui n'est pas exactement de la forme J M H, mais ce n'est pas vraiment un 
problème). Ce choix nous permet d'avoir 

ôH(g t ) = q' t 5ir t - ii' t ôq t 

même pour ce ce type de variations, ce qui redonne les équations flVII.134p . Mal- 
heureusement, la définition de ce hamiltonien n'est pas encore suffisante. Dans 
les équations (1VH.134|) . les dérivées partielles de H sont à comprendre au sens 
"différentielles partielles". Or dans tout ce qu'on a fait, ces différentielles partielles 
ne s'appliquent, pour retrouver les formules f lVII.134j) . qu'à des tenseurs dont le 
support est dans la partie vide de l'espace-temps A4. Il faut donc modifier la den- 
sité lagrangienne "H à l'endroit où le tenseur d'énergie-impulsion n'est pas nul. Au 
final, nous travaillerons avec le lagrangien 

H = [ Hdv g + Ct 

JM t 

où % est la nouvelle densité lagrangienne. On voit facilement que les équations 
(IVII.134j) s'appliquent maintenant à toute variation de métrique qui conserve la 
platitude asymptotique. Le résultat qui nous intéresse surtout est le suivant : 

PROPOSITION VII. 140. Soit g une métrique asymptotiquement plate sur A4 = 
M x I, solution de l'équation d'Einstein en présence d'un système isolé. Alors 
1 1-)- C t est une fonction constante. 

Démonstration. On calcule d'abord 4:H(gt). Il faut remarquer que la varia- 
tion g t est admissible : elle conserve la platitude asymptotique. Elle ne l'était pas 
avec le lagrangien H (car la variation ^g t n'est pas à support dans la partie vide 
de Mt). Fixons t G I. On a d'après les équations flVII. 134|) : 

^ H{g t ) = pHv' + pHj = çV - tt'ç' = 0. (VII. 141) 

dtt=t on oq 

On a aussi 

- H(g t ) = — H(g t0 + sg' t0 ). 
dtt=t ds s =o 

On écrit g' to = h r + h' r où h ro = T]g' to , h' ro = (1 — T])r)g' to , r\ G [0, 1] étant une fonction 
de cut-off égale à 1 sur M to \ B 2ro et nulle sur B ro où B ro est une boule assez grande 
pour contenir toute la matière de M to . Par linéarité de la différentielle, on a 
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4 H(g t ) = — H(g to + sh ro ) + — H(g to + sh ro ). 
att=t ass=o ass=o 



Rappelons que 

Il est alors clair que 



H= / Udv G + C t . 

'M t 



lim 4 H(g to + sh r ) = 4 C t 
r^oo ds s =o att=t 



et que puisque h' r est à support compact, 

lim — H(g to + sti ) = 0. 

r^oo dSs=0 

Cette dernière égalité est obtenue en procédant comme pour obtenir flVII.14ip . On 
obtient ainsi, avec flVII.14ip . 

4 C t = 
dtt=t 

ce qui prouve la proposition. □ 



En physique, dès qu'une quantité est conservée, on a envie de l'interpréter comme 
une énergie. C'est ainsi que Arnowitt, Deser et Misner [ADM62J ont introduit ce 
qu'on appelle communément "la masse ADM" (on devrait plutôt dire "l'énergie 
ADM") et qui est définie par C t . Plus précisément, 

Définition. Soit (S, g) une hypersurface de type espace de Ai, asymptotiquement 
plate. La masse ADM de (£,<?) est définie par 

m(g):= lim — - / (djCju - d^v 3 ds^ 

r->oo lb7T Js r 

où les coordonnées utilisées sont celles fournies par la définition de la platitude 
asymptotique. 

Remarque VII. 142. 

(1) Le choix de la constante sera justifié plus loin. 

(2) La définition de la masse ADM est purement riemannienne, ce qui permet- 
tra, comme on le verra en fin de chapitre de définir la masse d'une variété 
riemannienne asymptotiquement plate qui n'est pas forcément une hyper- 
surface d'une variété lorentzienne. 

(3) La définition de la platitude asymptotique fournit des coordonnées dont le 
choix n'est unique. On peut montrer que la définition ci-dessus ne dépend 
pas de ce choix. 

Exemple important : La définition de la masse ADM est purement mathémati- 
que mais plusieurs indices confirment le fait qu'elle représente bien une énergie. 
D'abord, on verra une autre définition dans le prochain paragraphe, plus intuitive. 
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Ensuite, elle est bien nulle dans l'espace de Minkowski qui correspond à un espace- 
temps vide. Surtout, il y a l'exemple de la métrique de Schwarschild vu au Chapitre 
IVl On a vu que le paramètre c de la métrique g' c définie par la formule (1V.85|) 
s'interprétait comme le double de la masse de l'objet considéré. Par ailleurs, on 
remarque que les hypersufaces t = constante sont asymptotiquement plates. Un 
calcul simple montre que leur masse ADM est égale à | (ce qui donne une première 
justification du choix de la constante dans la définition de la masse ADM). 

2.4. Masse de Komar d'un système isolé. La définition de la masse ADM 
est très mathématique : elle apparaît naturellement en faisant des calculs pour 
obtenir une formulation hamiltonnienne de la relativité générale en présence d'un 
système isolé. On va maintenant essayer de définir l'énergie totale d'un système 
isolé de manière plus physique. Rappelons que la notion d'énergie locale n'est 
pas claire de manière générale. Nous supposons que la constante cosmologique est 
nulle, ce qui est physiquement cohérent puisque nous travaillons à petite échelle. 
Notons r le tenseur d'énergie impulsion. Puisque le système est isolé, le support de 
r sur toute hypersurface complète de type espace doit être compact. Si on utilise le 
modèle présenté dans le Paragraphe [T] (ce qui n'est pas nécessaire ici), cela revient 
à dire que l'image du support de r par le difféomorphisme conforme qui définit la 
platitude asymptotique ne rencontre pas l'infini spatial i$. Dans notre cadre, on se 
contentera de fixer une hypersurface S asymptotiquement plate. 

Pour simplifier les choses, nous allons commencer par supposer que le système 
considéré est un fluide parfait sans pression. Pour un observateur donné, l'énergie 
totale du système est approximativement égale à sa masse. En effet, les vitesses des 
systèmes isolés étudiés en cosmologie sont généralement faibles et on néglige tout 
ce qui concerne l'énergie cinétique. Revenons un instant à la mécanique classique. 
Considérons un système isolé et prenons une grande sphère S qui contient toute 
la matière. Si la sphère est assez grande et si la matière se trouve à une distance 
raisonnable du centre, le système peut-être assimilé à une masse ponctuelle m 
placée au centre. Notons <3> son potentiel newtonnien. Rappelons que $ = — — 
où r est la distance au centre (on rappelle que, depuis le début, on a pris des 
conventions qui font que la constante gravitationnelle k est égale à 1). Puisque 
l'aire de la sphère S* est 47rrQ, r étant son rayon, on a, en notant v := le 
vecteur normal sortant sur S 



Pour que les approximations faites soient valables, il faut que r soit grand. On 
définit donc la masse totale (et l'énergie du système) par 



Revenons à la relativité générale. Puisqu'elle a été construite pour retrouver les 
lois de Newton à vitesse faible, il paraît naturel de s'appuyer sur la formule ci- 
dessus pour définir la masse du système. D'abord, il faut, pour définir une énergie, 
se placer du point de vue d'un observateur. Il est évident que puisque de manière 
générale, l'énergie est liée à la vitesse, il faut choisir des observateurs convenables. 





(VII. 143) 
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Pour retrouver approximativement les lois de la mécanique classique, on va sup- 
poser que l'espace-temps (Ai, g) est statique et que l'on se place du point de vue 
d'un observateur galiléen, c'est-à-dire qu'il existe des coordonnées (t, y 1 , y 2 , y 3 ) 
dans lesquelles la matrice de g est donnée par 

/ -P o \ 

g\\ §12 <7i3 

§21 922 (]23 

\ g 31 g 32 g 3 3 / 

où /, g~ij ne dépendent pas de t. Par ailleurs, puisqu'on se place du point de vue 
d'un observateur galiléen, E est une hypersurface dont une équation est donnée 
par t = constante. En particulier, si on suppose que y 1 = x l (i — 1, 2, 3), la matrice 
de g dans les coordonnées (t 3 ) garde la forme ci-dessus. 

Dans ce cadre, on a vu à plusieurs reprises que la fonction / jouait en relati- 
vité générale le rôle du potentiel newtonnien. Prenons une grande sphère S ro : = 
{(x 1 , x 2 , x 3 )\r := (x 1 ) 2 + (x 2 ) 2 + (x 3 ) 2 = r } et notons v son vecteur unitaire normal 
sortant. Ainsi, la formule (IVH.143P devient, en relativité générale : 

m = — lim / g(Vf, v)ds- g 

47T r ->oo I q 

où dsg est l'élément de volume induit par g sur S ro . 

Notons B ro := {(x 1 ,x 2 , x 3 ) \r < r } la boule de rayon r . Pour obtenir une définition 
intrinsèque, on utilise le Théorème de Stokes puis la Proposition ( 1III.50I) pour écrire 
que 

m = -— lim / A s fdsg 

47T r ->oc J Bro 

= j- I R ab n a t b dv- g . 

Ici, on a utilisé les coordonnées (t,x l ,x 2 ,x 3 ). On a noté n a les coordonnées du 
vecteur n := f~ ■§£, ^-orthogonal à S, unitaire et orienté positivement. On a 
aussi noté t b les coordonnées du champ de vecteurs 4t. Autrement dit, t° = 1, 
t b = si b > 1. En utilisant l'équation d'Einstein, on voit que Rie = 8ttT où le 
tenseur T est défini par T = r — \T a bg ab g. Ainsi 

Cette écriture permet de donner une définition de la masse dans des conditions 
un peu plus générales que lorsque S est une hypersurface vue par un observateur 
galiléen d'un domaine statique. Tout d'abord, on n'a plus besoin de supposer que 
le fluide est parfait (la définition s'écrit indépendamment de p et u). On va aussi 
supposer que l'espace-temps est seulement stationnaire : 
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Définition. Un domaine f2 d'un espace-temps est dit stationnaire s'il admet un 
champ de Killing £ de type temps. 

La différence par rapport à un domaine statique est qu'on ne suppose plus qu'il 
existe une hypersurface E g-orthogonale au champ £. On suppose seulement que 
le flot du champ £ est isométrique. Pour comprendre cette nuance, imaginons une 
étoile sans rotation : on va obtenir des hypersurfaces E toutes isométriques or- 
thogonales à £. Supposons maintenant que cette étoile soit en rotation : on aura 
toujours ce feuilletage par des hypersurfaces E toutes isométriques mais les lignes 
de champ du fluide à l'intérieur de l'étoile seront en rotation et £ ne sera plus 
orthogonal à E. En particulier, pour que E soit l'espace vu par un observateur, il 
faut que cet observateur se trouve très loin du système (le champ £ est asymptoti- 
quement orthogonal à £). Ce n'est absolument pas gênant puisque, justement, on 
a supposé dans la définition de m que l'on se plaçait à l'infini. 

Remarque VII. 144. Faire l'hypothèse que l'espace-temps est stationnaire n'est 
à première vue pas vraiment satisfaisant : imaginons que le système isolé soit 
composé de deux étoiles. Puisque les hypersurfaces E sont toutes isométriques, 
cela signifie, d'après l'équation d'Einstein que la matière est répartie de la même 
manière dans E et donc que les deux étoiles se trouvent toujours à la même distance 
l'une de l'autre. C'est physiquement incohérent puisque deux corps quelconques 
vont avoir tendance à se rapprocher sous l'effet de la gravitation. Malgré tout, du 
point de vue d'un observateur à l'infini, le système est assimilé à un point ce qui 
justifie ce modèle. 

La définition ci-dessus n'impose pas de choisir E comme l'une de ces hypersurfaces 
isométriques. Cela amène finalement à la définition suivante introduite par Komar 



Définition. On suppose que l'espace-temps possède un champ de Killing £ de 
type temps. Soit E une hypersurface de type espace asymptotiquement plate. La 
masse de Komar est égale à 



où g est la restriction de g à E. 

Alors, Ashtekar et Magnon-Ashtekar |AMA79] ont montré que 

THÉORÈME VII. 145. Si E est asymptotiquement orthogonale àÇ (ce qui pour les 
raisons évoquées ci-dessus, est raisonnable d'un point de vue physique), les masses 
ADM et de Komar coïncident. 

La démonstration de ce théorème est beaucoup plus délicate qu'il n'y paraît. Nous 
ne la donnons pas ici (ce résultat n'est pas utile pour la suite). 



[K59] 




3. La condition d'énergie dominante 



Connaître la forme exacte du tenseur d'énergie-impulsion qui modélise le mieux 
la réalité est pratiquement impossible. Dans certaines situations, on va supposer 



3. LA CONDITION D'ÉNERGIE DOMINANTE 



113 



qu'on a un fluide parfait. Dans d'autres, on va tenir compte de l'électromagnétisme. 
Mais ces hypothèses s'utilisent dans des cas très précis. Nous allons faire une 
hypothèse dite "condition d'énergie dominante" sur le tenseur d'énergie-impulsion 
qui, elle, semble réaliste dans toutes les situations et sans laquelle certains énoncés 
plausibles sont faux. En particulier, les problèmes mathématiques décrits en fin de 
chapitre s'appuient sur cette hypothèse. 

Condition d'énergie dominante : Notons r le tenseur d'énergie-impulsion. 
Alors, pour tout champ de vecteurs W de type temps, 

(1) t(W, W) > 0; 

(2) t(W, ■) n'est pas de type espace (on ne distingue pas 1-formes et champs 
de vecteurs qui, par g, s'identifient canoniquement). 

La première des deux hypothèses s'appelle la condition faible d'énergie. Elle pour- 
rait s'interpréter comme une condition de positivité de l'énergie locale, bien que 
cette notion ne se définisse pas de manière rigoureuse. Dans le cas d'un fluide par- 
fait sans pression, elle dit que la densité de masse p est positive. Hoyle et Narlikar 
[HN69j ont donné un modèle d'espace-temps pour lequel cette condition n'était 
pas satisfaite. Leur but était de proposer un modèle dans lequel la densité de 
matière était constante dans le temps. Pour compenser l'expansion de l'univers, 
il y avait création de matière ex-nihilo à tout instant, ce qui contredit toutes les 
mesures physiques faites : la densité moyenne de matière est en chute constante. 
Le théorème IVIL147I empêche ce type de phénomène lorsque la condition faible 
d'énergie est vérifiée. 

La deuxième condition dit que le flux d'énergie est n'est pas de type espace, ce 
qui, pour un fluide parfait sans pression, dit que la matière ne peut pas voyager 
plus vite que la lumière (le vecteur u ne doit pas être de type espace). De manière 
plus générale, elle dit qu'aucune information ne voyage plus vite que la lumière. 

Soit ( Jj, Tj|r, -£-2, Tjfâ) une repère g-orthonormé en un point. On suppose que est 
de type temps. Alors, on montre facilement que la condition d'énergie dominante 
est équivalente au fait que dans ce repère, 

r 00 > \ T ab\ 

pour tous a, b G {1, • • • ,4). Cela justifie la terminologie de "condition d'énergie 
dominante" : comme on le verra dans le paragraphe Hl la coordonnée (0, 0) du ten- 
seur d'énergie-impulsion s'interprète comme une énergie (voir aussi le Paragraphe 
du Chapitre HU). 

Remarque VII. 146. Soit (t, x , x 2 , x 3 ) des coordonnées locales. La discussion 
ci-dessus montre que 

r ï =ï r 00 > 0. 

On donne maintenant une conséquence importante de la condition d'énergie do- 
minante : 
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THÉORÈME VII. 147. Soit (A4, g) l'espace-temps de la relativité générale. On 
suppose que le tenseur d'énergie-impulsion vérifie la condition d'énergie domi- 
nante. On suppose aussi qu'il existe un champ de vecteurs t de type temps qui 
ne contient pas d'orbite fermée (i.e. avec la terminologie du Chapitre I VI\ l'espace- 
temps est causalement stable). Soit U un domaine d'adhérence compacte dans Ai. 
Notons S la partie du bord dont le vecteur normal unitaire sortant est de type 
temps et orienté positivement. On suppose que r est identiquement nul sur dU\H. 
Alors t est identiquement nul sur U. 

Ce théorème dit que l'information ne peut pas voyager plus vite que la lumière. 
C'était déjà l'interprétation donnée à la deuxième hypothèse dans la condition 
d'énergie dominante mais cette interprétation était intuitive. Ce théorème donne 
un énoncé précis. En effet, on peut décomposer le bord de U en trois parties : 

- S qui est de type espace et dont le vecteur normal sortant est orienté positive- 
ment ; 

- £' qui est de type espace et dont le vecteur normal sortant est orienté négative- 
ment ; 

- S" qui n'est pas de type espace. 

Alors on peut voir £' comme un sous-ensemble de l'espace S vu par un observa- 
teur. On suppose que £' est vide. Imaginons qu'une information partant de £ \ X' 
se propage. Pour entrer dans U, soit elle doit aller plus vite que la lumière, soit elle 
doit traverser Or par hypothèse, S" est vide ce qui fait que cette information 
doit aller plus vite que la lumière. Ce théorème dit que cela n'arrive jamais. On 
remarque aussi que ce résultat interdit la création spontanée de matière. 




Figure 2. Condition d'énergie dominante 

Démonstration. D'abord, le Théorème IVI.97I dit que si Ai est causalement 
stable, il existe une fonction t dont le gradient est partout non nul et de type temps. 
Sans restreindre la généralité, nous supposons que t = V£ et nous noterons t a les 
composantes de ce vecteur quand on l'exprimera dans un système de coordonnées 
locales. Nous noterons pour s G R, U(s) = Un {t < s}. Notons enfin H (s) = {t = 
s}. Posons 

x{s):= r ab t a t b dv g = ! ( / T ab t a t b dv 9sl ) ds' 

JU(s) JR \JH(s')nU J 
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où g s ' est la restriction de la métrique g à H (s'). Alors, 



x\s) = / r ab t a fdv ga > 0. (VIL 148) 

JH(s)nU 

On a utilisé ici la condition d'énergie dominante. Posons maintenant 

/(*):= / V\r ab t a )dv g . (VII.149) 
Ju(s) 

On a 

I(s) = [ V\r ab )t a dv 9 + / T ab V b t a dv g 

JU(s) Ju(s) 

L'équation d'Einstein impose que V b r ab = ce qui fait que , 

I(S) = [ T ab VH a dv g . 
JU(s) 

Par ailleurs, en tout point de U, grâce à la remarque, on peut trouver a > tel 
que 

r ab {at a t b - V h t a ) > 0. 
Par compacité de U, il existe C > tel que 

r ab V b t a < Cr ab t a t b 

ce qui donne 

I(s) < Cx{s) (VII.150) 
Revenons à la définition (IVIL149P et utilisons le Théorème de Stokes : 

J(s)= / r ab t a n b ds g 

JdU(s) 

où les n b sont les composantes de n , le vecteur unitaire sortant (7-orthogonal à 
dU (s). Le bord de U (s) se décompose en trois parties : U(s) DE, U (s) H (M\ E) et 
H (s) fi [/. Sur la deuxième de ces trois parties, le tenseur d'énergie- impulsion est 
nul. Sur U(s) H E, le vecteur n est orienté positivement. La condition d'énergie 
dominante implique que r ab t a n b > 0. On en déduit que 

I(s) > [ T ab t a n b ds g . 
JH(s)nu 

Par ailleurs, sur H (s) DU, t et it sont proportionnels donc il existe c > tel que 

I(s)>c / r ab t a t b ds g = cx\s) 
JH(s)r\U 

En revenant à ( lVII.150j) . on obtient qu'il existe une constante Co (égale à G je) 
telle que x'(s) < C x(s). Supposons que x n'est pas identiquement nul. Alors, il 
existe a tel que x > sur }a,b[ et tel que x(a) =0 car x est nul au voisinage de 
—00. Soit e > petit. On a 

ln(x(b)) -\n(x(a + e)) = [ ^-ds < C (b - (a + e)). 
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On arrive à une contradiction en faisant tendre e vers ce qui termine la démonstration 
du théorème. □ 



4. Le quadrivecteur de moment-énergie 

Plaçons-nous en relativité restreinte et considérons un fluide parfait sans pression. 
De la même manière qu'en relativité générale, on peut définir le tenseur d'énergie- 
impulsion par l'expression 

r = pdu (g) dit 

où dlî := g(-,lt). Considérons maintenant un observateur galiléen D dirigé en un 
point par un vecteur n de norme —1 et orienté positivement. Maintenant, appelons 
F l'espace vu par cet observateur. Le vecteur n est le vecteur orthogonal unitaire 



orienté positivement. On écrit 



lî = ait + k 



où k G F. Alors, la vecteur — est la vitesse du fluide par rapport à l'observateur 

D au point considéré. On note v = ' g(k , k ) la vitesse au sens habituel. Posons 
maintenant 

^ = -r ab n a 

où les n a désignent les composantes du vecteurs n dans la base canonique. On a 

~P = —pdlîÇrî) lî = —pgÇit, it) [ait + k) = p(a 2 lt + a k). 
Par ailleurs, puisque g(lt, lî) = —1, on a a 2 (— 1 + v 2 ) = —1 si bien que 

Alors, exprimé dans une base (lî, f^, /^) où (/\ f*, f°) est une base de F* , on 
trouve que P a pour composantes 

/ E \ 

Pi 

P-2 

\PsJ 

OÙ 

E 



1 - V 
et 




p k /a 
= 1-v 2 ' 

Autrement dit, en se rappelant que p est la densité de masse, ~~È est la densité 
d'énergie du fluide (voir le Paragraphe 13.21 du Chapitre IIHj) vu par D tandis que 
les trois dernières composantes de F représentent la densité d'impulsion du fluide 
vu par D. Le vecteur P s'appelle le quadrivecteur de moment- énergie du fluide vu 
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par D au point considéré. 

Remarque importante : Puisque la matière ne peut pas voyager plus vite que 
la lumière, on a v = -y g( k , k ) < 1 ce qui implique que P^ est de genre temps. 



De même, en relativité générale, on définit P = —r a } i n b où les n b sont les com- 
posantes du vecteur normal à une hypersurface de type espace. Cependant, ce 
vecteur n'a pas vraiment de sens physique, tout comme l'énergie locale n'en avait 
pas. Par contre, dans le cas d'un système isolé, on peut définir un quadrivecteur 
de moment-énergie ADM dont la première composante est la masse ADM et dont 
les trois autres composantes (P 1 , P 2 , P 3 ) sont 



lim / 2{hik — 5ikhjj)dse 

i-^+oo 16tt J Sr k 33 ' s 



R->+oo 16tï J s 

où comme pour la masse ADM, S est une hypersurface asymptotiquement plate 
de seconde forme fondamentale h et ds^ est la métrique induite par la métrique 
euclidienne sur la sphère Sr. La manière d'aboutir à ces formules est similaire à 
celle qui permet d'obtenir la masse ADM et nous ne la détaillerons pas ici. 



5. Masse positive et moment-énergie positif 

Les considérations précédentes conduisent à plusieurs problèmes mathématiques 
qui, encore actuellement, sont activement étudiés. Dans ce paragraphe, nous présen- 
tons les problèmes de la masse positive et du moment-énergie positif. 



5.1. Masse positive. On notera £ la métrique euclidienne sur M 3 . 

Définition. Soit (M, g) une variété riemannienne de dimension 3. 

- Un bout asymptotiquement plat de (M, g) est un ensemble ouvert E de M 
difféomorphe au complément d'une boule dans M 3 tel que, dans les coordonnées 
induites par ce difféomorphisme, la métrique g satisfasse : 

C C —C 

1 9ij - I < , I d k gij | < , Rie 9 > J^9, 

pour |x| grand. 

- La variété riemannienne (M, g) est asymptotiquement plate s'il existe un compact 
K de M tel que (M \ K, g) est une union de bouts asymptotiquement plats. 

L'exemple le plus simple est (R 3 ,£) qui est une variété asymptotiquement plate 
avec un bout. Un autre exemple est la métrique de Schwarschild qui apparaît dans 
le Chapitre [Vj 



Théorème de la masse positive : Soit (M, g) une variété asymptotiquement 
plate (connexe) de dimension 3 dont la courbure scalaire est partout positive ou 
nulle. Alors, 

m 9 (E) > 
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( où m 9 est la masse ADM définie sur chaque bout comme dans le paragraphe \2.3\) 
sur chaque bout E avec égalité si et seulement si {M, g) est isométrique à (IR 3 ,£). 

Remarquons que nous sommes sortis du cadre lorentzien. Ce théorème a été 
d'abord montré par Schoen et Yau dans |SY79j . Witten |Wit81] a trouvé une 
preuve plus simple en toute dimension lorsque la variété est spin (ce qui est tou- 
jours le cas en dimension 3). Lockhamp a publié sous forme de preprint une preuve 
complète du problème mais à ma connaissance, aucun mathématicien n'a réussi à 
comprendre complètement son argument. 

Donnons aussi quelques explications sur les hypothèses de ce théorème. L'idée 
ici est de considérer que M est une hypersurface de genre espace totalement 
géodésique d'un espace-temps (Ai, G). Sous la condition d'énergie dominante, il 
est plausible de dire que l'énergie totale (c'est-à-dire la masse ADM) vue par un 
observateur doit être positive. Dans cette situation, la condition d'énergie domi- 
nante se traduit par le fait que la courbure scalaire sur M est positive ou nulle. En 
effet, prenons un système de coordonnées tel que la matrice de G vérifie Goo = — 1, 
G a o = pour a > 1, G a b = g a b pour a, b > 1. On peut aussi se débrouiller pour que 
gab = ô a b en prenant des coordonnées normales. La condition d'énergie dominante 
dit que les composantes du tenseur d'Einstein E vérifient : E 00 > E a f, et donc 
3-Eoo > g ab E a b (puisque g ab = ô ab pour a,b > 1). Or i? o = (car, puisque M est 
totalement géodésique, Rica = Ricdp +Ric g = Ric g ). Donc E 00 = — jRG 00 = \R. 
Ici R est à la fois la courbure scalaire de g et de G. On aboutit finalement à 
\R > -\R, c'est-à-dire à R > 0. 

5.2. Moment-énergie positif. Soit (Ai, g) un espace-temps de la relativité 
générale et M une hypersurface de type espace asymptotiquement plate. Dans 
ce cadre, cela signifie que M est asymptotiquement plate au sens du paragraphe 
précédent mais qu'en plus la courbure moyenne h vérifie sur chaque bout 

ha = 0(r- 2 ) et d k h tj = 0(r- 3 ). 

Alors, 

Théorème du moment-énergie positif : Sous la condition d'énergie dominante, 
le quadrivecteur de moment- énergie ADM est de type temps ou lumière. S'il est de 
type lumière, alors, la métrique G est plate le long de M. 

Ce théorème a été démontré par Parker et Taubes [PT82]. La condition d'énergie 
dominante dit que la matière ne voyage pas plus vite que la lumière, ce qui est 
nécessaire pour dire que le quadrivecteur de moment-énergie est de type temps 
(voir Paragraphe H]) . 



CHAPITRE VIII 



Effondrement gravitationnel et trous noirs 

Le but de ce chapitre est d'étudier les trous noirs sans supposer, comme dans le 
Chapitre [V] que l'espace-temps possède des symétries en espace. Plus généralement, 
on se propose de préciser la notion de singularités d'un espace-temps. Elles peuvent 
se présenter sous diverses formes mais la conjecture de la censure cosmique stipule 
que dans la réalité physique, outre le Big-Bang, seules celles de type trou noir 
peuvent exister. On sera alors conduit à la conjecture de Penrose dont l'énoncé est 
purement mathématique et qui concerne la masse ADM d'une variété asymptoti- 
quement plate, lorsque le système isolé étudié est un trou noir. 

1. Singularités de l'espace-temps 

Une bonne définition de "singularité de l'espace-temps" n'est pas si facile à formu- 
ler. Le Big-Bang en est une ainsi que les trous noirs et les trous blancs qui appa- 
raissent dans le Chapitre |V] Une possibilité pourrait être de définir une singularité 
comme un endroit où la métrique et ses dérivées explosent mais la notion d'endroit 
n'est pas bien claire. On va donc plutôt s'appuyer sur l'existence de géodésiques 
incomplètes. Il faut prendre garde au fait que certaines singularités sont, avec cette 
définition, créées artificiellement en enlevant un point régulier à un espace-temps. 
Il sera donc souvent commode de travailler soit avec des espaces-temps inexten- 
sibles ou alors, si on impose certaines conditions, causales par exemple, travailler 
avec des espaces-temps dont toute extension perd les propriétés requises. 

Revenons maintenant sur la signification physique de l'incomplétude des géodési- 
ques. Lorsque la géodésique est de type temps, la présence d'une singularité réelle 
est évidente : il existe des observateurs ou des particules dont la durée vie dans 
le futur ou le passé est finie. De même, si une géodésique de type lumière est 
incomplète (rappelons que d'après la remarque (1I.189|) . cette notion a bien un 
sens), cela signifie qu'un photon a durée de vie finie dans le passé ou dans le futur. 
Notons que cette durée de vie est mesurée par un observateur extérieur car le temps 
propre d'un photon n'a pas de sens. Même si la signification physique est moins 
claire, il faut garder cet aspect dans la définition des singularités : on peut en effet 
construire des exemples où toutes les géodésiques de type temps sont complètes 
mais où il existe des géodésiques de type lumière incomplètes. Pour finir, notons 
que l'existence de géodésiques incomplètes de type espace n'a pas vraiment de sens 
physique. C'est pourquoi nous adopterons la définition suivante : 

Définition. On dit qu'un espace-temps (Ai, g) possède une singularité s'il existe 
des géodésiques incomplètes de type temps ou lumière. 
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Maintenant, nous allons essayer de trouver des moyens de détecter la présence de 
singularités. Pour cela, nous avoir besoin d'introduire quelques notions. 

La condition forte d'énergie : Nous avons déjà vu dans le chapitre IVHI la 
condition faible d'énergie ainsi que la condition d'énergie dominante. Nous avons 
maintenant besoin de la condition forte d'énergie : on suppose que la métrique g 
de l'espace-temps vérifie 

Ric(£,£)>0 (VIII.151) 

pour tout vecteur £ de type temps. En utilisant l'équation d'Einstein (1111.57p . on 
voit que cette condition est équivalente à 

r(£,£)>-~T (VIII.152) 

pour tout £ de type temps, où r est le tenseur d'énergie- impulsion et où T := g ab r a b 
est sa trace. Supposons qu'on soit en présence d'un fluide parfait. Puisque r est 
symétrique, il existe en chaque point une base g-orthonormée ( t , X\, x 2 , 2^3) 
dans laquelle la matrice de r est diagonale. A part dans le cas de fluides très par- 
ticuliers où la densité de masse est nulle, on peut supposer que t est de type 
temps et que pour tout i — 1, 2, 3, Xi est de type espace. La valeur propre p cor- 
respondant au vecteur t est la densité d'énergie (qui est la somme de la densité 
de masse et de l'énergie causée par la pression) tandis que les trois autres valeurs 
propres p±,P2,P3 sont appelées pressions principales. Alors, 

- la condition faible d'énergie est équivalente à p > et p + pi > pour tout i ; 

- la condition forte d'énergie est équivalente à p + Y^h=i Pi — e ^ P + Pi — P our 
tout i ; 

- la condition d'énergie dominante est équivalement à p > \pi\ pour tout i. 

On admet généralement qu'un espace-temps physiquement cohérent satisfait ces 
trois conditions. Dans ce paragraphe, on aura surtout besoin de la condition forte 
d'énergie. Remarquons que pour qu'elle soit fausse, il faudrait que ou bien la den- 
sité d'énergie soit négative, ou bien que ce soit les pressions principales qui le 
soient, et avec une valeur absolue "grande" relativement à la densité de masse. 

L'expansion : Considérons un champ de vecteurs £. Nous définissons le 2-tenseur 
B a b '■= V a £b. Examinons la signification physique de B. Soit p un point et 7(i) la 
courbe intégrale de £ passant par p. Supposons maintenant qu'en p, la matrice de 
la forme bilinéaire B p exprimée dans une base (Ai, - , A4) de T p Ai soit diagonale. 
Regardons comment se comporte le champ de vecteurs £ au voisinage de p. Pour 
simplifier les notations, on identifie Ai à M 4 et TAi à M 4 x T P AA au voisinage de 
p. Lorsque e tend vers 0, £(p + eXi) se comporte comme £(p) + XieXi où Aj est la 
valeur propre de B p associée à Aj. Ainsi, si \ > 0, la courbe intégrale de £ passant 
par p + eXi va avoir tendant à s'éloigner de 7 tandis que si À, < 0, cette courbe 
intégrale va au contraire avoir tendance à s'approcher de 7. Le champ de tenseurs 
B mesure la "dispersion" des courbes intégrales de a au voisinage d'un point. 
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Plaçons-nous maintenant dans le cas où le champ de vecteurs £ est unitaire et tan- 
gent à une congruence de géodésiques de type temps. Dans ce cas, B est purement 
spatial : c'est-à-dire que 

£(£,•) = £(-, = o. 

En effet, B ab Ç b = (V a £è)£ 6 = V a (Çb£, b ) — £ b V a £ft, c'est-à-dire, puisque g est parallèle 
2B ab ^ b = V a (6£ b ) = en se rappelant que Ç b Ç b = 1. 

Remarquons que puisque £ est unitaire, on peut définir une métrique h spatiale 
par : 

g ab = h ab -Ub- (VIII.153) 

La métrique h n'est définie que sur l'espace vectoriel g-orthogonal à £ dans l'es- 
pace tangent du point considéré. Ce n'est donc pas une métrique. Malgré tout, 
nous conservons cette terminologie parce, lorsque £ est orthogonal à une famille 
d'hypersurfaces, h est simplement la restriction de g à ces hypersurfaces et est 
alors une métrique riemannienne. 

Définition. La trace := B ab h ab est appelée expansion au point p. 

La raison pour ne prendre la trace que par rapport à la partie spatiale de g est 
claire. Cela dit, B étant purement spatiale, le résultat aurait été le même en prenant 
la trace par rapport à g. Il n'est peut-être pas inutile de donner une deuxième 
interprétation géométrique de l'expansion : prenons une surface S orthogonale à 
la congruence et notons St l'évolution de la surface S le long de la congruence 
au temps t (i.e. pour chaque point p de S, il existe une géodésique 7 telle que 
7(^0) = P- La surface St est définie comme l'ensemble des points j(to + t)). On 
suppose que sur S, l'expansion est strictement négative. Alors, au moins pour t 
petit, l'aire de S t est plus petite que celle de S. 

Intuitivement, il est facile de s'imaginer qu'une expansion trop négative va conduire 
à une "convergence des géodésiques" conduisant à une singularité. Cette intuition 
est illustrée par le théorème suivant : 

THÉORÈME VIII. 154. Supposons que £ est un champ de vecteurs tangents à 
une congruence de géodésiques de type temps toutes orthogonales à une famille 
d'hypersurfaces. On suppose aussi que la condition forte d'énergie est satisfaite. 
S'il existe un point sur une géodésique de la congruence pour lequel 6 < 0, alors 
6 explose (vers —00) le long de cette géodésique en un temps fini. 

Démonstration, (une esquisse) On calcule que, si s est le paramètre de la 
géodésique considérée, on a : 

^e(s) = ~e(s) - a ab a ab + w ab w ab - R a b^ b 

où 

111 
a ab '■= 7,\Bab + B ba ) - -Qh ab , w ab = -{B ab - B ba ) 
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où h est définie par (1VIII.153j) . Le fait que £ soit orthogonale à une hypersurface 
permet de dire que w a b = et la condition forte d'énergie implique finalement que 

^e W + ie W <o. 

Puisque qu'il existe s tel que O(s ) < 0, on en déduit que 0(s) explose au plus 
tard en s = s + ttt-t. □ 



Ce théorème n'est pas tout à fait satisfaisant : il ne montre pas que l'espace-temps 
est singulier mais seulement que la congruence considérée l'est. Malgré tout, avec 
d'autres hypothèses, on peut montrer que la singularité obtenue grâce à ce résultat 
est vraiment une singularité de l'espace-temps. 

On voudrait maintenant étendre la définition précédente lorsque la congruence 
considérée est constituée de géodésiques de type lumière. Là encore, B est pure- 
ment spatial puisque cette fois £ a £ a = 0. Dans ce cadre, on comprend bien qu'il 
n'aurait pas de sens de prendre la trace de B par rapport à g, d'où la définition de 
l'expansion donnée ci-dessus qui coïncide pourtant avec la trace totale de B lorsque 
les géodésiques sont de type temps. Puisque £ est de type lumière, la métrique g 
ne prend jamais la forme (1VIII.153I) . Ce n'est pas un vrai problème : il suffit de 
définir h en prenant la restriction de g à l'orthogonal de £. Remarquons que la 
métrique h obtenue est dégénérée, ce qui n'est pas non plus un vrai problème 
puisque nous n'avons pas besoin de calculer hr 1 dans la définition de l'expansion. 
Malgré tout, dans certaines situations, en particulier lorsque l'on cherche un ana- 
logue du Théorème (1VIII. 154j) . la dégénérescence de h présente des difficultés qui 
se résolvent en remplaçant h par une métrique non dégénérée bien choisie (voir 
[Wa84j ) 

Les surfaces piégées : Commençons par considérer une sphère S centrée en 
l'origine et paramétrée par r = r et t = est dans les coordonnées sphériques de 
l'espace de Minkowski (R 4 ,r] = dt 2 + (dx 1 ) 2 + (dx 2 ) 2 + (dx 3 ) 2 ). S est donc de 
dimension 2. Pour fixer les choses, on peut considérer que r = 1 et t = 0. Soit 
maintenant p G S. Pour simplifier, on prend p = (0,1,0,0). L'espace tangent à 
S en p est donc engendré par V% = (0,0,1,0) et Vi = (0,0,0,1). L'ensemble de 
tous les vecteurs tangents aux géodésiques de type lumière issues de p (que nous 
normalisons avec une coordonnée temporelle égale à 1, ce qui n'a de sens que dans 
l'espace de Minkowski) est donné par T = {(1, v-i, v%, v 3 )\v 2 + v\ + 1>| = 1}. Soit 
v = (1, t>i, t> 2 , t>3) G T. Notons E-$ l'orthogonal à lï. Il est clair que Vi, V 2 G E-$ 
si et seulement si lï G {(1, 1, 0, 0), (1, -1, 0, 0)}. 

Cette construction se généralise à tout espace-temps et on peut formuler : 

PROPOSITION VIII.155. Considérons une surface S de dimension 2 de type 
espace d'un espace-temps (M, g). En tout point p de S, il existe exactement deux 
géodésiques de type lumière issues de p et orthogonales à S en p. L'ensemble de ces 
géodésiques forment deux que nous appellerons congruences 
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orthogonales de type lumière associées à S. Leurs expansions respectives seront 
notées 0i et 62. 

Pour être précis, ce ne sont pas de vraies congruences au sens donné dans le Cha- 
pitre Uni puisque toutes les géodésiques considérées sont issues de S et leur réunion 
est donc d'intérieur vide. 

Lorsque la surface S borde un domaine Q borné dans une hypersurface de type 
espace qui contient S 1 , l'une des congruences orthogonales de type lumière associées 
se dirige vers l'intérieur de Q : on l'appellera la congruence entrante tandis que 
l'autre, la congruence sortante, se dirige vers l'extérieur de Q. On notera parfois 
Q Ê et Q s à la place G 1 et G 2 leurs expansions respectives. 




Figure 1. Sphère non piégée dans l'espace de Minkowski 

On a vu plus haut une interprétation de l'expansion en termes d'aire : dans ce 
cadre, on peut dire que l'aire du front d'onde diminue avec le temps (c'est-à-dire 
qu'en faisant évoluer la surface S par l'une ou l'autre des congruences définies 
ci-dessus, la nouvelle surface obtenue a une aire plus petite). 

Revenons maintenant au cadre de Minkowski avec les notations ci-dessus : on cal- 
cule facilement qu'en tout p G S, Q e (p) = —2 et Q s (p) = 2. Autrement dit, les 
géodésiques de la congruence entrante ont tendance à se rapprocher et celles de la 
congruence sortante à s'éloigner, ce qui correspond tout à fait à l'intuition (voir 
la Figure [T]). Plaçons- nous maintenant dans l'espace de Schwarzschild. Contraire- 
ment à la surface S ci-dessus, toutes les sphères de la forme {p} x S 2 où p G 0J2 
vérifient G e , G s < 0. On a utilisé les notations du Chapitre |V] Cela s'interprète 
physiquement en remarquant que dans le trou noir de l'espace-temps de Schwarz- 
schild, les rayons lumineux vont être confinés dans une région "bornée" et vont 
avoir tendance à se rapprocher. On peut raisonnablement penser qu'une surface 
ayant une telle propriété devrait permettre de détecter des trous noirs ou tout au 
moins des singularités, ce qui nous amène à la définition suivante : 

Définition. Une surface S de dimension 2, compacte, de type espace d'un espace- 
temps (M, g) est appelée surface piégéesi les congruences G 1 et G 2 sont strictement 
négatives sur S. 
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Conformément à l'intuition et au prix de quelques hypothèses, les surfaces piégées 
permettent effectivement de détecter des singularités, comme le montre le résultat 
suivant prouvé par Penrose en 1965 : 

THÉORÈME VIII.156. Considérons un espace-temps (A4, g). On suppose que 

- la condition forte d'énergie est satisfaite; 

- (A4, g) possède une surface de Cauchy non compacte (il est donc globalement 
hyperbolique ) ; 

- il existe une surface piégée S. 

Alors, il existe au moins une géodésique de type lumière incomplète (et donc il 
existe une singularité dans (A4, g).) 

Démonstration. (Une esquisse) Avant de commencer la démonstration, nous 
présentons deux résultats que nous admettrons mais qui, intuitivement, se com- 
prennent bien. 

Résultat A : Soit S une surface compacte de type espace. Le bord dI + (S) du fu- 
tur chronologique de S (voir Chapitre I VTj) est une variété C° fermée et achronale 
délimitée par les deux congruences orthogonales associée à S . De plus, supposons 
qu'une géodésique de l'une de ces congruences en rencontre une autre (le point de 
rencontre est dit conjugué à S), alors, à partir de ce point, elle cesse d'être dans 
le bord de I + (S). Bien évidemment, elle reste dans I + (S). 

La première partie du résultat se comprend bien et n'est d'ailleurs pas trop difficile 
à montrer rigoureusement (mais la démonstration n'est pas très instructive). Le 
fait que dI + (S) soit achronale se déduit du fait qu'aucune courbe de cet ensemble 
n'est de type temps. Pour comprendre intuitivement la deuxième partie, il suffit 
d'imaginer ce qui se passe dans le cas où S est la sphère r = 1 et t = de l'espace 
de Minkowski déjà étudiée ci-dessus. La Figure [2] illustre bien la situation. 




Figure 2. 

Résultat B : Soit S une surface piégée. Notons a = sup p6S max(0 1 (p), Q 2 (p)). 
Alors, toute géodésique de type lumière orthogonale à S en rencontre une autre en 
un temps majoré par A . 

L'expression "en un temps majoré par A" dans l'énoncé ci-dessus n'est pas très 
habile dans le sens où une géodésique de type lumière ne possède pas de temps 



1. SINGULARITÉS DE L'ESPACE-TEMPS 



125 



propre. Cependant, pour chacune de ces géodésiques, une paramétrisation affine 
est implicitement choisie à travers le champ £ qui intervient dans la définition de 
B (et la valeur de l'expansion dépend de ce choix). Le sens de l'expression "en un 
temps majoré par A" est donc à comprendre relativement à ce choix de paramètre. 

Intuitivement, ce résultat dit que puisque les géodésiques ont tendance à se rap- 
procher, elles vont finir par se rencontrer (voir aussi la Figure [2] où seule la 
congruence entrante de géodésiques orthogonales à S a une expansion négative : 
ces géodésiques se rencontrent en un temps fini). Ce résultat est un peu long à 
démontrer de manière rigoureuse. 



Les résultats A et B ont la conséquence suivante : 



Conséquence : Supposons que (Ai, g) n'a pas de singularité, alors le bord dI + (S) 
du futur chronologique de S est compact. 



En effet, notons Ci les deux congruences orthogonales de type lumière associées 
à S. On définit pour i = 1,2 /j : Sxl- > M. qui à (p, t) associe le point j(t) 
où 7 est la géodésique de la congruence Cj qui passe par p et qui est choisie 
pour que 7(0) = p. Puisque (M., g) n'a pas de singularité, 7 est définie sur M et 
la définition de fi a bien un sens. Alors, dI + (S) est un sous-ensemble fermé du 
compact K := f^S x [0, £]) U f 2 (S x [0, f]). En effet, dI + (S) est fermé et par le 
résultat A, puisque dI + (S) est délimité par C\ U Ci, on a 

dI + (S) C fi(S X M) U f\(S x E). 

Par ailleurs, d'après le résultat B et la deuxième partie du résultat A, pour tout 
p G S, t > X, fi{p, t) £ dI + {S). Cela prouve bien que dI + {S) C K et ainsi dl + (S) 
est compact. 



On est maintenant en mesure de démontrer le Théorème (1VIII.156j) . Puisque 
(Ai, g) est orienté en temps (on rappelle que tous les espaces-temps avec lesquels 
nous travaillons satisfont cette hypothèse), on peut choisir un champ de vecteurs 
t de type temps en tout point de M.. Ce champ de vecteurs permet de "proje- 
ter" dI + (S) sur la surface de Cauchy E donnée par l'énoncé du théorème de la 
façon suivante : à un point p G dI + (S), on associe un point i/j(p) G S en sui- 
vant la courbe intégrale de t qui passe par p. Le point ip(p) est unique puisque 
S est de Cauchy. Comme ip est clairement continue, ip(dI + (S)) est un ensemble 
compact de S. Par ailleurs, ip est injective puisque dI + (S) est achronale et ainsi 
ip : dI + (S) — > ip(dI + (S)) est un homéomorphisme lorsque l'on munit tp(dI + (S)) 
de la topologie induite par celle de S. Puisque ^(dI + (S)) est une sous-variété 
C°, pour tout point q G ip(9I + (S)), il existe un voisinage de q dans ip(dI + (S)) 
homéomorphe à une boule ouverte, ce qui implique que ip(9I + (S)) doit être ou- 
verte dans E. C'est impossible car ip(dI + (S)) est compacte et E est non compacte. 
Cela démontre le Théorème (lVIII.156j) . □ 
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Le Théorème (1VIII.156j) a tout de même un inconvénient : supposons que dans un 
espace-temps satisfaisant la condition forte d'énergie, on trouve une surface piégée. 
Alors, on ne peut pas en déduire qu'il existe une singularité : il se pourrait que 
l'espace-temps ne soit pas globalement hyperbolique. En fait, on peut se passer 
de cette hypothèse (au prix d'autres hypothèses moins fortes) mais nous nous 
limiterons ici à ce résultat. 



2. Trous noirs 



Là encore, il est moins facile qu'on ne pourrait le penser de donner une définition 
précise d'un trou noir. Intuitivement, c'est une région de l'espace-temps qui ne 
laisse sortir aucun rayon lumineux, ni aucune matière. Malheureusement, on ne 
peut pas se borner à cette propriété sans quoi le futur causal J + {p) de tout point 
p de l'espace de Minkowski serait qualifié de trou noir. Il faut en plus que dans un 
certain sens, les rayons lumineux ne puissent pas aller à l'infini. On est confronté 
au même problème que celui rencontré dans le Chapitre IVHI lorsqu'on cherchait à 
modéliser les systèmes isolés : on avait alors besoin d'une notion d'infini spatial. 
Ici, c'est d'un infini futur de type lumière dont nous avons besoin. 

2.1. Retour sur le diagramme de Carter-Penrose. Comme dans le Cha- 
pitre IVHt nous allons avoir recours au diagramme de Carter-Penrose pour définir 
l'infini futur de type lumière. Pour cela, rappelons que l'espace de Minkowski se 
compactifie comme sur la Figure Q] du Chapitre IVHI en utilisant des coordonnées 
(T, R, (p), vues comme des coordonnées sphériques sur M. x S 3 et définies par 

{T := arctan(t + r) + arctan(t — r), 
R := arctan(t + r) — arctan(t — r). 

où (t, r, (p) sont les coordonnées sphériques sur M 4 . Plus de précisions sont 
données dans le Chapitre IVHI Avec ce modèle, l'infini futur de type lumière est 
modélisé par 

J + := {(T, eT\T + R = 7r;R>0y 

Vérifions que cet ensemble correspond bien à nos attentes. Toute droite de type 
lumière dans l'espace de Minkowski est paramétrée en coordonnées sphériques par 

{(s + t ,s + r ,tf ,<p )\s e M} 

où t , r , r , <£>o sont fixés. L'infini futur correspond à ce qui se passe quand s tend 
vers l'infini. On a alors 

Tqo := lim T = tt/2 + arctan(t — ^o) et R<x — nm -R = vr/2 — arctan(t — r ) 

s— >co s— >co 

ce qui montre, puisque + R^ = ir que la limite est bien dans J + . 



Considérons maintenant un espace-temps (A4, g) asymptotiquement plat défini 
comme dans le Paragraphe [T] du Chapitre IVHI L'infini futur (resp passé) J + 
(resp. J~) de type lumière est défini par 

J" + (resp. J~) = dJ + (i ) \ z (resp. dJ~(i ) \ i ). 
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Pour être tout à fait précis, il serait nécessaire de donner des conditions supplémen- 
taires sur le facteur conforme, ce qu'on ne fera pas ici. 

Nous allons dans le paragraphe suivant donner une définition générale de trou 
noir dans le cadre d'un espace-temps asymptotiquement plat. Ce n'est pas une 
restriction importante puisqu'on étudie un objet "petit" et que l'on peut négliger 
au voisinage du trou noir l'influence de tout autre corps céleste. Il est malgré 
tout possible de donner une définition plus plus générale en étendant la notion 
les diagrammes de Carter-Penrose au cadre non-asymptotiquement plat mais les 
difficultés techniques sont importantes relativement au gain obtenu. 



Figure 3. Diagramme de Carter-Penrose pour l'espace de Schwarzschild 

Pour atteindre notre but, nous allons nous inspirer du cas sphérique. Le diagramme 
de Carter-Penrose de l'espace de Schwarzschild est représenté sur la Figure [3] (que 
nous dessinons "à plat" plutôt que sur un demi-cylindre pour plus de lisibilité). 

On voit très nettement que les géodésiques de type temps ou lumière de la région 
"trou noir" vont venir s'écraser sur la partie notée "singularité" et n'ont aucun 
moyen d'atteindre ni l'infini temporel futur i + ni l'infini futur de type lumière J + . 
C'est sur cette propriété que nous allons nous appuyer pour donner la définition 
générale d'un trou noir. 

2.2. Trou noir d'un espace-temps asymptotiquement plat. Nous sup- 
posons donc que l'espace-temps (Ai, g) est asymptotiquement plat, ce qui comme 
nous l'avons déjà expliqué, n'est pas très restrictif. Les définitions plus générales 
ont une complexité technique qui n'est pas justifiée par rapport à ce qu'elles ap- 
portent. Dans le diagramme de Carter-Penrose de l'espace de Schwarzschild (voir 
Figure |3]), la région extérieure est caractérisée par le fait qu'il existe des géodésiques 
de types temps ou lumière qui atteignent i + ou J + . Cette partie est exactement 
égale au passé causal J~(J + ) (voir Chapitre IVip . Bien évidemment, ce passé causal 
est à comprendre dans la compactification conforme de (Ai, g) que nous noterons 
(Ai, g) et qui est donnée par la définition de la platitude asymptotique de (Ai, g). 
Notons qu'il y a un abus de notations puisque le passé causal de J + peut s'étendre 
à l'extérieur de Ai (on rappelle que via cette compactification conforme, Ai est un 
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domaine de M). Il est évident que nous ne travaillons que dans Ai et c'est pour- 
quoi nous garderons cette notation au lieu d'utiliser Ai n J~(J + ). Pour éviter des 
problèmes provenant de situations physiques non plausibles, nous allons supposer 
que cette région extérieure au trou noir a de bonnes propriétés. Nous allons faire 
l'hypothèse que (Ai, g) est asymptotiquement prédictible au sens fort : 

Définition. Un espace-temps asymptotiquement plat (Ai, g) est asymptotique- 
ment prédictible au sens fort si J~(J + ) est globalement hyperbolique. Dans cette 
définition, l'adhérence est bien évidemment à comprendre au sens de la topologie 
de (M, g). 

On est maintenant en mesure de donner une définition de trou noir : 
Définition. 

- Un espace-temps asymptotiquement prédictible au sens fort possède un trou noir 
si Ai n'est pas contenu dans J~ (J + ). La région de trou noir B est définie par 
B := Ai \ J~(J + ). Nous parlerons souvent de trou noir pour une composante 
connexe de B. 

- Le bord d'un trou noir (ou le bord de la région extérieur au trou noir) dB = 
d.J~(J + ) est appelé horizon des événement. 

Il est important de noter que 

un espace-temps asymptotiquement prédictible au sens fort ne contient 
que des singularités de type trou noir, 

c'est-à-dire cachées derrière l'horizon des événements, du moins si l'on suppose 
que l'horizon des événements ne possède pas lui-même de singularité. C'est une hy- 
pothèse généralement admise par les physiciens. Imaginons en effet qu'une géodési- 
que 7 de type temps ou lumière inextensible ne soit pas prolongeable après un 
temps fini T. Supposons aussi que quand t est proche de T, ^y(t) est dans J~(J + ). 
Alors dans l'espace-temps compactifié (M, g), l'adhérence J~~(J + ) est compact 
et dans cet espace, la limite P de j(t) lorsque M T a un sens (alors que dans 
(Ai, g), ce n'était pas le cas du fait que la notion de complétude n'a pas de sens sur 
une variété lorentzienne) . Puisque 7 est inextensible, il est clair P n'est pas dans 
l'intérieur de J~(J + ) ce qui ne laisse qu'une possibilité : P G dJ~(J + ). L'ensemble 
J+ représente les "infinis de M" et par conséquent, toute géodésique qui échoue 
à cet endroit est définie jusqu'en +00. Ainsi, nécessairement, par définition, P ap- 
partient à l'horizon des événements, ce qui est exclu par hypothèse. Cela prouve 
que la géodésique va pénétrer dans la région de trou noir. 

Supposons maintenant que l'espace-temps ne soit qu'asymptotiquement plat et pas 
nécessairement asymptotiquement prédictible au sens fort. Alors, il peut y avoir 
des singularités visibles depuis J + c'est-à-dire telles qu'il existe une géodésique 7 
qui n'est pas prolongeable après un temps fini T et qui vérifie que pour tout t < T 
proche de T, j(t) G J~(J + )- 

Définition. Une telle singularité est appelée singularité nue. 
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Un exemple de singularité nue est celle de type "Big-Crunch" (Chapitre II Vj) . Un 
autre exemple est donné par l'espace-temps de Kerr (voir Paragraphe [3]) qui selon 
les valeurs des paramètres va posséder soit une singularité de type "trou noir" soit 
une singularité nue. 



2.3. Effondrement gravitationnel et conjecture de la censure cos- 
mique. Revenons un instant sphérique : on a vu dans le Chapitre [V] que 
si la masse de l'objet considéré est trop grande relativement à son rayon, il y 
aura formation d'un trou noir et le système ne sera pas stable. C'est ce qu'on 
appelle V effondrement gravitationnel. La question qui se pose naturellement est 
de savoir si cette situation est générique. On pourrait suspecter que le fait de 
se placer en symétrie sphérique parfaite (ce qui est physiquement déraisonnable) 
provoque la naissance du trou noir. Il n'en est rien : prenons un espace-temps à 
symétrique sphérique, qu'il est naturel de supposer globalement hyperbolique, et 
voyons-le comme le développement maximal de Cauchy associé à des conditions 
initiales (S , h , K ) (voir Chapitre IVip . A l'extérieur de l'étoile, la métrique est 
de Schwarzschild et on a vu que les sphères {p} x S 2 où p G u 2 étaient des surfaces 
piégées. Maintenant, considérons un espace-temps (A4, g) issu de conditions ini- 
tiales proches de (So, ho, Ko) qui brisent la symétrie sphérique. Alors, le Théorème 
I VI. 1011 qui donne la continuité par rapport aux conditions initiales, va impliquer 
que (Ai, g) va lui aussi posséder des surfaces piégées. En particulier, si on sup- 
pose des conditions physiquement plausibles sur le tenseur d'énergie-impulsion, 
en particulier si on suppose la condition forte d'énergie, le Théorème I VIII. 1561 va 
impliquer que l'espace-temps (Ai, g) a une singularité et que, toujours en vertu 
de la continuité par rapport aux conditions initiales, cette singularité sera de type 
trou noir (cela se démontre rigoureusement). On a montré qu' 

un effondrement gravitationnel dans un espace-temps physiquement 
plausible d'un objet "presque sphérique" induit une singularité de type 
trou noir. 

Rien ne dit qu'il n'est pas possible de produire des singularités nues si l'espace- 
temps est loin d'être à symétrie sphérique. Malgré tout, il est naturel de penser 
que les objets qui se créent dans l'univers sont toujours suffisamment proche de la 
situation symétrique. Cela conduit à penser que toute singularité produite par un 
effondrement gravitationnel est de type "trou noir". D'où 

Conjecture de la censure cosmique (version faible, formulation phy- 
sique) : toute singularité due à un effondrement gravitationnel est cachée dans 
un trou noir et n'est pas visible pour un observateur éloigné. 

ce qui se formule mathématiquement par : 

Conjecture de la censure cosmique (version faible, formulation mathéma- 
tique) : Considérons des conditions initiales (E , ho, K ) où (S , ho) est une 
variété riemannienne complète, satisfaisant de bonnes conditions de décroissance 
à l'infini (pour que le développement maximal de Cauchy soit asymptotiquement 
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plat). On suppose que le tenseur d'énergie-impulsion r a des propriétés physique- 
ment plausibles (il vérifie les conditions forte d'énergie et d'énergie dominante). 
Le développement maximal de Cauchy associé aux conditions initiales (Eo, ho, Ko) 
et à r est alors asymptotiquement prédictible au sens fort. 

Remarque VIII. 157. Dans la formulation physique, on ne parle que de singula- 
rités dues à un effondrement gravitationnel et dans la formulation mathématique, 
on ne regarde que les singularités qui se forment après un temps donné. La raison 
en est simple : le Big-Bang qui est une singularité nue ne doit pas être proscrit par 
l'énoncé de la conjecture. 

Nous n'avons pas donné dans le Chapitre |VÏ] de définition de "développement 
maximal de Cauchy" en présence de matière et nous ne serons pas plus précis 
ici, mais le sens d'un tel objet, au moins approximativement, se comprend bien. 
Remarquons aussi que la formulation mathématique est un peu plus forte : on 
ne dit pas seulement que toutes les singularités sont de type "trou noir" mais on 
dit que l'espace-temps est asymptotiquement prédictible au sens fort, ce qui est 
plus contraignant d'après la discussion précédente. Pour finir, mentionnons que la 
terminologie de "Conjecture de la censure cosmique" est issue d'une plaisanterie 
de Penrose et Hawking : elle stipule que les singularités nues sont cachées. 

2.4. Propriétés générales des trous noirs. Dans ce paragraphe, nous don- 
nons sans grande rigueur deux propriétés des trous noirs. Nous nous plaçons donc 
dans un espace-temps (Ai, g) asymptotiquement prédictible au sens fort, dont 
le tenseur d'énergie-impulsion a une forme plausible (condition forte d'énergie et 
condition d'énergie dominante) et nous supposons qu'il existe une région B de trou 
noir. On suppose que (Ai, g) est un développement de Cauchy maximal et est donc 
de la forme / x E où / est un intervalle de R et où E est une variété non compacte. 
Via cette écriture, parler de 1"' instant t" a un sens. Notons ainsi B t := B(l {t} x E 
le (ou les si B a plusieurs composantes connexes) trou noir à l'instant t. On montre 
d'abord le résultat suivant : 

THÉORÈME VIII.158. Un trou noir ne peut ni disparaître ni se diviser. 

Démonstration, (une esquisse) Pour simplifier, supposons qu'à l'instant to, 
B to a exactement une composante connexe (c'est-à-dire qu'il n'y a qu'un trou noir). 
Prenons une géodésique 7 de genre temps issue de B to et montrons qu'elle inter- 
secte Bt pour tout t > to. C'est en fait évident puisque E t := {t} x E étant une 
surface de Cauchy, 7 doit intersecter E t . Par ailleurs, puisqu'aucune géodésique de 
type temps ne peut sortir de B, le point d'intersection de 7 et E 4 est dans B donc 
dans B t . Cela montre que B t a au moins une composante connexe. Cela traduit le 
fait qu'un trou noir ne peut pas s'éteindre. 

Supposons maintenant que B t a plusieurs composantes connexes (disons deux 
pour simplifier) : Bi et B 2 . Prenons p G B tQ . Le cône de lumière J + (p) de p est 
entièrement inclus dans B puisqu'aucun rayon lumineux ne peut sortir d'un trou 
noir. Par ailleurs, on montre facilement que J + (p) est connexe et donc entièrement 
inclus à l'instant t soit dans B\ soit dans B 2 . Le cône de lumière à l'instant t étant 



3. ESPACE-TEMPS DE KERR 



131 



clairement "continu" par rapport à p, le cône de lumière de tout point de B to à 
l'instant t est contenu toujours dans la même composante connexe de B t (i.e. dans 
B\ ou B 2 ). Il peut donc y avoir création de trou noir mais B to n'a pas pu se divi- 



Le résultat précédent était intéressant pour préciser l'image que l'on a en tête d'un 
trou noir. Le résultat suivant est plus technique mais il jouera un rôle important 
pour la formulation de l'inégalité de Penrose (voir ci-dessous). 

THÉORÈME VIII. 159. (Hawking, 1971) L'aire de l'horizon des événements H t := 
d(B) H E t à l'instant t est décroissante dans le temps. 

Démonstration, (une esquisse très imprécise) On montre d'abord que toute 
surface piégée est nécessairement contenue à l'intérieur du trou noir. A l'aide de 
ce résultat, on réussit à en déduire que les expansions 1 et O 2 associées à H t 
(voir le paragraphe concernant les surfaces piégées) sont positives ou nulles, sans 
quoi H t pénétrerait à l'intérieur de B, contredisant sa définition. Pour finir, fixons 
to G / et choisissons l'une des deux congruences - appelons-la C- de type lumière 
orthogonales à la surface H to . On montre que chacune de ses géodésiques croise 
H t (où t > to est fixé) en un point exactement. Cela permet de construire une 
application injective ip : H to — > H t . On a vu dans le paragraphe concernant les 
surfaces piégées que l'expansion d'une congruence caractérisait l'évolution de l'aire 
du front d'onde. Ainsi, dans ce cadre, puisque l'expansion de C est positive ou nulle, 
l'aire de H to est plus petite que celle de ip(H to ). Comme ip(H to ) C H t , on en déduit 
que l'aire de H to est plus petite que celle de H t . □ 



Il est fréquent de rencontrer en cosmologie des objets en rotation et donc pas à 
symétrie sphérique (il faudrait pour cela travailler dans un espace-temps de dimen- 
sion 3). L'espace-temps de Kerr fournit une solution particulièrement intéressante 
de l'équation d'Einstein : il décrit une singularité "en rotation" qui est selon la 
valeur des paramètres, soit une singularité nue soit un trou noir en rotation (ce 
qui physiquement, a une existence tout aussi probable qu'un trou noir statique). 

On se place sur M. 4 en coordonnées sphériques. La métrique de Kerr est définie par 



ser. 



□ 



3. Espace-temps de Kerr 




(VIII.160) 



+ (r 2 + a 2 ) sin 2 Qd^ 2 - dt 2 + —^-{a sin 2 Ody? - dt) 2 



où a, M sont des paramètres dont nous préciserons le sens plus loin, où 
p = r 2 + a 2 cos 2 et A = r 2 - 2Mr + a 2 . 



Il y a plusieurs remarques à faire : 

- lorsque a = 0, on retrouve la métrique de Schwarzschild ; 
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- les coefficients de la matrice de gk dans ces coordonnées ne dépendent ni de t ni 
de cp : les champs de vecteurs (J^) et (j^J son t donc des champs de Killing. En 
particulier, 

- les hypersurfaces t = constante sont isométriques entre elles ce qui im- 
plique que l'espace-temps de Kerr est stationnaire (voir le Chapitre IVIip . 
Par contre, à part dans le cas où a ^ 0, ces hypersurfaces ne sont pas or- 
thogonales au champ de vecteurs (^) et donc l'espace-temps de Kerr n'est 
pas statique. En fait, ces hypersurfaces "tournent" quand t augmente; 

- puisque (j^J est un champ de Killing, on a dans chaque hypersurface t = 
constante un groupe à un paramètre de rotations axiales (qui correspond 
à l'action de C§pj sur l'hypersurface considérée) qui sont des isométries. 
On dit que l'espace-temps de Kerr est axymétrique. 

- la métrique de Kerr n'est irrégulière qu'aux points où p ou A s'annulent. 

Le paramètre M s'interprète comme la masse de l'objet considéré tandis que a 
s'interprète comme le rapport du moment cinétique de Komar sur la masse. Sans 
donner plus d'explications, nous retiendrons que ce paramètre indique la vitesse 
de rotation du trou noir. Selon les valeurs de a et M, l'espace-temps de Kerr a 
deux structures causales de natures différentes, dont nous allons faire une étude 
séparée. 

3.1. Le cas a 2 > M 2 . Dans ce cas, A > r - 2Mr + M 2 = (r - M) 2 > et 
seul p = peut donner une singularité, ce qui ne se produit que lorsque r = et 
© = |. Autrement dit, si l'on s'approche de r = en venant d'une autre direction 
que 6 = |, on ne rencontre pas de singularité. 



Pour comprendre ce qui se passe, il convient de travailler dans d'autres coordonnées 
appelées coordonnées de Kerr-Schild. Nous ne les écrivons pas explicitement mais 
on construit de nouvelles coordonnées (x, y, z, t) dans laquelle la métrique de Kerr 
prend la forme suivante : 

g r = — dt 2 + dx 2 + dy 2 + dz 2 

2Mr 3 / 2 rxdx + ydy) — a(ydx — xdy) zdz\ (VIII. 161) 
r 4 + a 2 z 2 \ r 2 + a 2 r J 

Le t qui apparaît dans cette expression n'est pas celui qui apparaît dans l'expression 
(IVIII.160p mais comme il s'agit de la variable de temps, on ne changera pas la 
notation. Les coordonnées (x, y, z) ne sont pas les coordonnées sur M. 3 à partir 
desquelles on a construit les coordonnées sphériques (r,Q,(p). On a par contre la 
relation suivante : 

r 4 - (x 2 + y 2 + z 2 - a 2 ) - a 2 z 2 = 0. (VIII. 162) 

Une première remarque est que l'expression (lVIII.16ip montre que l'espace-temps 
de Kerr est asymptotiquement plat. Nous allons essayer de comprendre ce qui ce 
passe. On va noter E t les hypersurfaces t = constante. Dans S f , les surfaces S r qui 
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correspondent à r = constante (r ^ 0) sont des ellipsoïdes confocaux. Avec ces 
coordonnées, on approche de la singularité lorsque r — > 0. Dans ce cas, les surfaces 
S r , qui sont invariantes par les rotations autour de l'axe des z, dégénèrent en le 
disque 

% 2 + y 2 < a 2 ; et z — 0. 

que nous noterons S . Autrement dit, pour r petit, S r est un ellipsoïde circulaire 
dont l'épaisseur devient de plus en plus petite. 

Remarque VIII. 163. Le bord dSo est une vraie singularité de la métrique : la 
courbure y diverge. Par contre, à l'intérieur de disque, la métrique est régulière. En 
fait, supposons qu'une suite de points tende vers un point de dSo : cela correspond 
dans les coordonnées (r, 0, <p) à ce que r tende vers et tende vers |. Si la suite 
tend vers un point de l'intérieur de S , cela correspond toujours à r = mais cette 
fois ^ f • 

La situation est maintenant la suivante : on est sur M 3 (on reste toujours dans les 
hypersurfaces Et) et on a mis en évidence un disque de singularités dont en fait, 
seul le cercle bordant est réellement singulier. On peut raisonnablement se dire que 
cet espace-temps est inextensible. Ce n'est pas le cas : d'abord, même si au départ 
r > 0, on peut construire le même espace-temps avec r < 0, ce qui ne change 
rien puisque r n'apparaît dans la définition de la métrique qu'avec des puissances 
paires. On a construit ainsi (£ + ,g fc ) et (Ju~,g k ) qui sont isométriques mais dont 
les surfaces S r sont paramétrées pour l'un avec des valeurs positives de r et pour 
l'autre avec des valeurs négatives de r. On peut coller S + et S~ le long de Sq (en 
faisant bien attention à prendre la bonne orientation). On obtient un S qui est 
cette fois inextensible. Dans cette procédure, il faut prendre garde au fait que l'on 
recolle deux copies de M 3 le long d'un disque, c'est-à-dire le long d'une surface de 
codimension 2 ce qui n'est pas a priori évident. Pour avoir une bonne image en 
tête, supprimons la coordonnée y : cela revient à recoller deux copies de M? le long 
d'un segment. Ce n'est plus une variété. Mais il faut se souvenir que So est une 
position limite d'ellipsoïdes. Pour visualiser les choses, il suffit d'imaginer que le 
segment de recollement dans M? est une position limite d'ellipses. Pour avoir une 
bonne image en tête, on peut imaginer qu'on recolle les deux copies de M 2 le long 
d'ellipses proches de la position limite (voir Figure H]). 



Les ollipsi-'N "s'écrasent" 
en un segment 



Figure 4. Extension de l'espace-temps de Kerr à r < 
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Regardons maintenant la structure causale de l'espace-temps de Kerr. Il y a deux 
choses importantes à remarquer : 

- les hypersurfaces T, t ne sont pas de type espace. En particulier, le champ de 



Killing n'est plus de type temps lorsque l'on s'approche de la singularité 

(le bord de Sq). Ainsi les courbes d'équation t = constante, B = constante et 
r = constante (petite) fournissent des courbes fermées de type temps. 
- Carter a montré qu'à partir de tout point en dehors de la singularité, on pouvait 
construire une courbe causale (de type lumière ou temps) qui atteint l'infini 
futur de type lumière J + . En d'autres termes, un observateur situé en J + voit 
la singularité : c'est exactement la définition d'une singularité nue que nous avons 
donnée plus haut. 

Un espace-temps dans lequel une singularité nue existe n'est pas satisfaisant d'un 
point de vue physique : en tout cas, les lois habituelles de la relativité ne sont plus 
valides. Par exemple, dans ce cas précis, l'existence de courbes fermées de type 
temps est un réel problème. C'est aussi pour éviter ces situations que l'on ne sait 
pas traiter que la conjecture de la censure cosmique à été formulée. 

Remarque VIII. 164. En admettant que la conjecture de la censure cosmique 
est vraie, il n'existe pas de singularités nues. En particulier, il n'existe pas de 
situations physiques où a 2 > M 2 . Cela signifie qu'un trou noir doit avoir une 
vitesse de rotation pas trop grande comparativement à sa masse. 

3.2. le cas a 2 < M 2 . Dans ce cas, il y a deux singularités supplémentaires 
qui correspondent à l'annulation cette fois possible de A : elles se produisent sur 
les sphères S r+ et S r _ où 



On peut encore une fois faire une travail sur les coordonnées : comme dans le cas 
a 2 > M 2 , on peut étendre l'espace-temps à r < 0. La singularité r = est toujours 
une vraie singularité parce qu'elle correspond à une divergence des courbures. Par 
contre, les deux singularités S r± n'en sont pas vraiment : un changement de co- 
ordonnées permet de les supprimer. Nous ne ferons pas ici ces choix optimaux de 
coordonnées. 

Pour visualiser les choses, plaçons-nous encore une fois dans une hypersurface E t 
correspondant à t = constante, c'est-à-dire dans M 3 . La situation est alors la sui- 
vante : nous avons une singularité en r = (qui correspond à un point puisque, 
contrairement au cas précédent, nous n'avons fait aucun changement de coor- 
données particulier) et deux boules concentriques B r C B r+ de bords respectifs 
S r _ et S r+ . Une autre surface importante est Y ergosphère £ définie par 



qui n'est pas une sphère. Toutes ces surfaces délimitent des régions que nous 
représentons sur la Figure [5] et que nous notons 1,1 1,1 II et IV. 

Propriétés des régions I, II, III et IV : 




r± = M± VM 2 - a 2 . 



r = M+^/M 2 



— a 2 cos 2 {Q) 
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III 



horizon interne de Cauchy 




ir titille e.st 
la rotation 



IV : existence do particules statiques. 



Figure 5. L'espace-temps de Kerr dans le cas a 2 < M 2 



(1) On peut voir que S r+ est un horizon des événements de type lumière. 
Autrement dit, la région / U 77 est une région de trou noir et III U IV — 

(2) Dans la région 77, le cône de lumière (plus exactement, il s'agit la projec- 
tion du cône de lumière sur le facteur E dans la décomposition Ai = Sx/) 
de tout point est strictement orienté vers l'intérieur. Cela signifie que toute 
géodésique causale issue d'un point de 77 atteindra la région I en un temps 
fini. On regarde encore une fois les trajectoires des points via la projection 
sur le facteur S. Cette propriété n'est plus vraie dans la région I et toute 
géodésique causale de I n'atteindra pas forcément la singularité. La région 
I est en fait une sorte de "trou noir dans le trou noir" : toute géodésique 
causale qui y pénètre ne peut en ressortir. C'est pourquoi la sphère S r _ 
est appelée horizon interne de Cauchy. 

(3) La région 777 est à l'extérieur du trou noir mais à l'intérieur de l'er- 
gosphère. Dans cette région le champ de vecteurs est de genre espace. 
Ainsi les courbes 

r = constante, O = constante et y? = constante 

ne sont pas de genre temps. Cela signifie qu'il n'y a aucun observateur 
statique dans cette région : tout observateur est entraîné par la rotation 
du trou noir. 

(4) La région IV est celle où tout se passe bien : le champ de vecteurs 
est de genre temps. Puisque c'est un champ de Killing, les courbes 

r = constante, O = constante et ip = constante 

sont des courbes de type temps. Ces observateurs sont statiques. 

Nous n'étudions pas le cas a 2 = M 2 : tout se passe comme dans le cas a 2 < M 2 
exceptés que les régions I et II sont vides. 
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4. Inégalité de Penrose 

4.1. Énoncé. On va voir que les résultats obtenus dans ce chapitre conduisent 
à conjecturer qu'une certaine inégalité, formulée pour la première fois par Penrose, 
est vraie : 

Inégalité de Penrose Soit (M, g) une variété riemannienne asymptotiquement 
plate (connexe) de dimension 3 dont la courbure scalaire est partout positive ou 
nulle et intégrable sur M. On suppose que M a un bord minimal compact et que 
M ne contient aucune autre surface minimale compacte. Alors 



m 9( E \> x j\ËMk (VIII. 165) 

V 16/T 

où E est un bout de M et où \diM\ g est l'aire de dM. L'égalité a lieu si et seule- 
ment si (M, g) est isométrique à un demi- espace de Schwarzschild spatial (dont la 
définition est donnée ci-dessous. 

Demi-espace de Schwarzschild spatial : il s'agit d'une tranche spatiale de l'es- 
pace de Schwarzschild qui correspond à l'extérieur du trou noir. Plus précisément, 
il s'agit de (M 3 \ B(0, y), G) où m > 0, B(0, y) est la boule euclidienne de rayon 
Y et où G est la métrique conforme à la métrique euclidienne de M 3 définie par 

Cette conjecture est maintenant prouvée : Huisken et Ilmanen [HI69J l'ont démon- 
trée lorsque le bord de M est connexe en utilisant le flot de la courbure moyenne in- 
verse et Bray |Br01j a donné une preuve complète en utilisant une autre méthode. 
Cette inégalité peut s'écrire en tout dimension n et la méthode de Bray en fournit 
une preuve jusqu'en dimension 8. Le cas des dimensions supérieures est encore 
ouvert. Pour des précisions sur les preuves évoquées ci-dessus, on renvoie le lecteur 
à Herzlich [Her03j qui décortique les idées mises en oeuvre de manière très claire. 



5. D'où vient cette conjecture ? 

D'abord les hypothèses sur la courbure sont similaires à celles vues pour le problème 
de la masse positive du Chapitre (IVIip . La formulation physique serait plutôt la 
suivante : 

Inégalité de Penrose (formulation physique) : Soit (Ai, g) un espace-temps 
asymptotiquement prédictible au sens fort et qui contient un trou noir. Soit S une 
surface de Cauchy. Alors, 

m(£)>\/— (VIII.166) 

V 167T 

où m(E) est la masse ADM de E et où \H\ est l'aire de l'horizon des événements 
H de E. 

C'est cette version que nous allons regarder. Pour cela, prenons un espace-temps 
globalement hyperbolique (Ai, g) où Ai = I x E (I est un intervalle). Pour tout 
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t G /, on définit 



ait) 



m(E t ) 



où E t = {t} x E et où H t est l'horizon des événements associé à E f . D'après le 
Théorème IVIII.1591 le dénominateur de a{t) est croissant tandis que d'après la 
définition de la masse ADM donnée dans le Chapitre IVIIj. son numérateur est 
constant. Ainsi, la fonction a tend vers son minimum lorsque t — > sup/. 

La question est maintenant de savoir ce qui se passe lorsque t — > sup /. Il est rai- 
sonnable de penser que le trou noir, qui aura absorbé toute la matière alentours 
va progressivement se " symétriser" , soit de manière sphérique s'il n'y aucune ro- 
tation, soit de manière axymétrique s'il est en rotation. Même s'il n'existe pas 
pour l'espace-temps de Kerr de théorème analogue au Théorème IV.831 il y a tout 
de même quelques résultats intéressants d'unicité si on impose d'être dans le vide 
et dans un espace-temps stationnaire. On peut donc penser qu'il est très pro- 
blable que lorsque t — > sup J, la surface Et évolue vers une surface de Cauchy 
d'un espace de Kerr. Ainsi, si pour l'espace-temps de Kerr de paramètres a, m, 
on définit a a ,M{t) de la même manière que l'on a définit a, on obtient qu'il existe 
t , a, M (avec a 2 > M 2 pour rester dans le cas d'un trou noir) tels que pour tout 
t, a(t) > a ay Mito). Or on calcule facilement que 



ce qui conduit immédiatement à l'inégalité de Penrose. 

Remarque VIII. 168. - L'égalité dans l'inégalité de Penrose n'est atteinte que 
dans le cas où E est une surface de Cauchy de l'espace de Schwarzschild. La raison 
en est simple : le minimum dans (IVIII.167|) est atteint lorsque a = 0, c'est-à-dire 
pour l'espace de Schwarshild. On peut en fait ajouter un terme positif ou nul au 
membre de droite de l'inégalité de Penrose, qui est nul seulement lorsque a = et 
qui rend l'inégalité optimale pour toute surface de Cauchy de l'espace de Kerr. Ce 
terme fait intervenir le moment cinétique de Komar que nous ne définirons pas 
ici. On peut encore écrire une égalité plus générale : il existe des espaces-temps 
appelés espaces-temps de Kerr chargés qui modélisent les trous noirs chargés 
en rotation et qui dépendent de trois paramètres : a, M, e. Pour e = 0, on 
retrouve l'espace de Kerr usuel. Pour ces espaces chargés, l'inégalité de Penrose 
modifiée avec le moment cinétique de Komar n'est pas non plus optimale. On 
peut encore une fois ajouter un terme au membre de droite dépendant de e et 
donnant l'égalité pour toute surface de Cauchy d'un espace de Kerr, chargé ou 
non. 

- Si pour ces inégalités, on est capable de fournir des contre-exemples, c'est que 
les hypothèses faites sont physiquement fausses. Il y alors deux possibilités : 
soit la conjecture de la censure cosmique (version faible) est fausse, soit c'est 
l'hypothèse qui dit qu'un trou noir quelconque évolue dans le temps vers un 
trou noir de Kerr qui est fausse. Tous les physiciens semblent d'accord pour 
dire que la première hypothèse a beaucoup plus de chance d'être fausse que la 
seconde. 




(VIII. 167) 



CHAPITRE IX 



Ondes gravitationnelles 

Ce chapitre s'inspire en grande partie des notes de cours de Master 2 d'Éric Gour- 
goulhon |Go lO|. 

Jusqu'à présent, on a étudié comment la matière, traduite sous forme géométrique 
par l'intermédiaire du tenseur d'énergie-impulsion, influençait les trajectoires des 
petits objets avoisinants. Pour cela, on étudiait les propriétés des géodésiques de 
certaines métriques. Dans ce chapitre, on va étudier comment la matière influe 
directement sur la "forme" de l'espace-temps. Plus précisément, on va montrer 
comment dans certains cas, l'accélération de matière produit des ondes appelées 
ondes gravitationnelles et qui se propagent à la vitesse de la lumière dans l'uni- 
vers. Ce phénomène est à comparer aux ondes électromagnétiques qui résultent 
de l'accélération de charges électriques avec cependant une différence importante : 
les ondes électromagnétiques sont des oscillations du champ magnétique tandis 
que les ondes gravitationnelles sont des oscillations de l'espace-temps lui-même, 
c'est-à-dire qu'elles se lisent directement sur les coefficients de la métrique. 

Ces ondes avaient été prédites dès 1916 par Einstein comme conséquence de la 
relativité générale. Comme nous le verrons dans ce chapitre, leur influence sur la 
matière se calcule : elle peuvent donc théoriquement être détectées de manière 
expérimentale. C'est le but des projets franco-italien VIRGO, américain LIRGO 
et américano-européen LISA, actuellement en construction. VIRGO a réussi en 
2004 à détecter les premières interférences gravitationnelles. 



1. Compacité d'un objet astronomique 

Pour mettre en évidence les ondes gravitationnelles, nous allons expliciter l'équation 
d'Einstein en la linéarisant. Pour que cette approximation soit physiquement cohérente, 
il faut l'on se place à un endroit où l'espace-temps n'est pas trop "tordu". Nous 
allons donc nous intéresser dans ce chapitre à des systèmes physiques qui n'en- 
gendrent pas de distortions trop importantes de l'espace-temps. Par exemple, il 
semble naturel de penser qu'il faudra éviter de travailler au voisinage immédiat 
d'un trou noir. Nous allons pour quantifier cette déformation introduire la notion 
de compacité d'un objet astronomique. 

Prenons donc un objet astronomique (étoile, planète) de masse M, que l'on suppose 
être à symétrie sphérique. On regarde maintenant la métrique de Schwarschild 
produite par cet objet lorsque toute autre matière est négligée : puisque d'après le 
paragraphe 12.21 du Chapitre |V] le nombre c de la formule IV.85I s'interprète comme 
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Objet 



paramètre de compacité 



Terre 
Soleil 



1(T 6 



Naine blanche 
Etoile à neutron 
Trou noir stellaire 
Trou noir massif 



10" 4 à 10" 3 



~ 0.2 
0.5 
0.5 



Figure 1. Paramètres de compacité 



2M, elle est donnée par 




2M 



r 



) 



dt 2 + 



1 



r 



dr 2 + r 2 k 



(IX.169) 



où k est la métrique standard sur S 2 . Le paramètre de compacité de l'objet étudié 
est alors donné par 



où r est le rayon de l'objet exprimé dans les coordonnées ci-dessus. Ce nombre, 
sans dimension, mesure la déformation de l'espace-temps par rapport à l'espace de 
Minkowski à sa périphérie. Comme nous l'avons dit plus haut, si ce paramètre de 
compacité est trop élevé, l'équation d'Einstein linéarisé n'aura aucune chance de 
modéliser correctement la réalité physique. 

La Figure [T] présente une liste des paramètres de compacité de quelques objets 
connus. 

En ce qui concerne les trous noirs, on remarquera que, puisque S = 0.5, on a sup- 
posé que r est exactement le rayon de Schwarschild (c'est-à-dire celui pour lequel 
une singularité apparaît). Le problème est évidemment qu'on ne peut pas savoir 
ce qui se passe au delà de l'horizon du trou noir. Attribuer une valeur de 0.5 au 
paramètre de compacité d'un trou noir est donc une convention. 

Remarque IX. 170. On entend souvent que plus une étoile est dense, plus elle se 
rapproche de la situation où elle va former un trou noir. Les légendes des Figures 
|2] et [3] du Chapitre IVl sont d'ailleurs "Étoiles à densité faible/forte". En fait, il 
s'agit là d'un abus de langage : ce n'est pas la densité (égale à la masse/volume 
et qui se comporte comme M/tq) qui indique si un objet est proche ou non de 
former un trou noir, c'est son paramètre de compacité. Il existe par exemple des 
objets très denses mais à faible compacité : le proton a une densité de l'ordre de 
celle d'une étoile à neutrons alors que son paramètre de compacité est de l'ordre 
de 10~ 39 . Réciproquement, le trou noir central de la galaxie M87 a une densité qui 
est environ l/300ème de celle l'eau, alors que son paramètre de compacité est de 



M 



0.5. 



2. ÉQUATION DES ONDES 
2. Équation des ondes 
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Dans cette section, nous allons donner quelques résultats de base concernant 
l'équation des ondes sur l'espace de Minkovski (IR n+1 , if) où rj = Diag(— 1, 1, • • • , 1). 
Nous noterons (t, x 1 , ■ • ■ , x n ) les coordonnés canoniques sur l'espace de Minkovski. 
Il s'agit de résoudre l'équation 



Du = (IX.171) 

où, rappelons-le, 

n- — _>T — 

i=i 

Nous aurons toujours existence de solution mais nous allons voir que pour ob- 
tenir l'unicité, il faudra se fixer des conditions initiales en t = 0. Nous ne nous 
intéresserons pas au passé et n'étudierons que la propagation d'une onde dans le 
futur. Finalement, le problème avec condition initiale se ramène à trouver une 
fonction u G C 2 ([0, +oo[xIR n ) qui vérifie 



où (p, ip : M. n — > R sont continues. 



Du =0 sur ]0, +oo[x] 
u(0,x) = (p(x) 
d u(0,x) = ip(x), 



2.1. En dimension 2 = 1 + 1. Pour simplifier les calculs, nous nous plaçons 
dans le cas où n = 1. Nous montrons 

THÉORÈME IX. 172. Les paramètres ip,ip étant fixés, il existe une et une seule 
solution u G C 2 ([0, +oo[xM n ). De plus, la valeur de u au point (t, x) ne dépend que 
de la valeur de (p(x — t), (p{x + t) et des valeurs de ip sur le segment [x — t, x + t] . 

Avant de commencer la preuve, il convient de faire quelques remarques. D'abord, 
les ondes ont réellement un comportement relativiste (ce qui n'est pas étonnant 
puisque c'est leur étude qui a conduit à formuler la théorie de la relativité res- 
treinte). En effet, Dans l'espace de Minkowski ([0, +oo[xIR"', rj), notons J~(t,x) le 
passé causal du point (t,x) tel qu'introduit au Chapitre EU autrement dit J~(t,x) 
est le triangle de sommets (t, x), (0, x — t), (0, x + t) (voir Figure |2]). 

Alors, le Théorème IIX.1721 dit que le comportement de l'onde en (t,x) ne dépend 
que de ce qui se passe sur J~(t,x). En fait, comme on le verra dans la preuve, 
cela dépend réellement de tout J~(t,x) : c'est-à-dire que si l'on change la valeur 
des conditions initiales cp ou ip au voisinage de x — t et x + 1, alors, cela affecte la 
valeur de u au point (t,x). Autrement dit, une onde se déplace dans le vide à la 
vitesse de la lumière. 

Remarque IX. 173. 

(1) Attention, la terminologie usuelle pour l'équation des ondes utilise le terme 
de domaine de dépendance pour l'ensemble J~(t,x) qui n'a donc pas la 
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Figure 2. Domaine de dépendance 



même signification que le domaine de dépendance introduit dans le Cha- 
pitre eu 

(2) Supposons qu'une onde soit représentée par une fonction u solution de 
l'équation 

Uu = f (IX. 174) 

où / est une fonction fixe. Supposons aussi que l'on connaisse une solution 
particulière uq de (1PX.174|) alors u s'écrit u = uq + v où v est solution de 
pX.17ip . En particulier, une modification des conditions initiales affecte 
v seulement et se propage comme dans le cas sans second membre à la 
vitesse de la lumière. Autrement dit, les ondes modélisées par l'équation 
(1IX.174P se propagent elles-aussi à la vitesse de la lumière. 

(3) Trouver une solution particulière à l'équation flIX.1741) n'est pas difficile : 
il suffit de procéder comme dans la preuve du Théorème IIX.172I et de 
poser a = x — t, b = x + t ce qui permet de se ramener à une équation de 
la forme ^^ù(a,b) = f(a,b). 

Passons maintenant à la preuve du Théorème IIX.1721 

Démonstration. On va montrer que u est entièrement déterminée par la 
formule de d'Alembert : 

1 i r +t 

u (t, x ) = ~((p(x-t)+<p(x + t)) + - ip(s)ds. (IX.175) 

2 2 J x _ t 

D'abord, on vérifie facilement que la fonction u ainsi définie est C 2 et est solution 
de l'équation des ondes avec conditions initiales. Cela prouve la partie existence 
du théorème. Réciproquement, soit u une solution C 2 de l'équation des ondes avec 
conditions initiales. En revenant à la définition de □, on peut écrire 

f d 2 d 2 \ ( d d\ ( d d\ 

= Du(t, x)= ^--—^ U (t, x)= + U (t, x). 
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En effectuant le changement de coordonnées a = x — t et b = x + t, on obtient 

Ùb ÛM = 

où û est défini par û(a,b) = u(x,t). Cette nouvelle équation dit qu'il existe deux 
fonctions /, g : M — > M de classe C 2 telles que û(a, b) = f(a) + g(b). On a donc 
montré que 

u{t,x) = f{x -t) + g{x + t). (IX.176) 
Avec cette formule, les conditions initiales deviennent : 

<p{x) = f(x) + g{x) et ^{x) = -f(x) + g'{x). (IX.177) 
Calculons maintenant en utilisant (IPX. 1771) 

x+t 

^(s)ds = —f(x + t) + f(x — t) + g(x + t) — g(x — t) 

x—t 

= 2(f{x -t)+ g(x + t)) - (f(x + t)+ g(x + t)) - {f{x - t) + g{x - t)) 
Avec (I1X.176P et (HX.177j) . on obtient 

x+t 

ijj(s)ds = 2u(t, x) — <f(x + t) — ip(x — t) 



' x—t 

qui donne exactement la formule flIX.175p . De cette formule, on déduit l'unicité 
(puisque <p et ip déterminent complètement u) ainsi que la dépendance. □ 

2.2. En dimension supérieure. En dimension supérieure, des raisonnements 
similaires peuvent être faits. Nous ne les indiquerons pas ici. Par ailleurs, en 
utilisant la transformée de Fourier, on s'aperçoit que les fonctions peuvent se 
décomposer en somme de sinusoïdes. Autrement dit, toute solution u est une 
somme finie de fonctions de la forme 

^ e î(felx 1 H \-k n x n ±wt) 

ou encore lorsqu'on cherche des solutions réelles, de fonctions de la forme 

A cos^ix 1 H h k n x n ± ut) 

dites solutions monochromatiques (une seule fréquence), où A est une matrice et 
où ki,-" ,k n ,cu G R. De plus, on déduit immédiatement de l'équation (1IX.171j) 
qu'il faut imposer que 

k 2 l + ... + k 2 n = tu 2 . (IX. 178) 

Le nombre u s'appelle la fréquence de l'onde monochromatique. 

3. Existence des ondes gravitationnelles 



Dans cette section, on va montrer comment la relativité générale conduit à l'exis- 
tence d'ondes gravitationnelles. 
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3.1. Équation d'Einstein linéarisée. Pour mettre en évidence les ondes 
gravitationnelles, nous allons linéariser l'équation d'Einstein en travaillant dans des 
domaines de l'espace de Minkowski (IR n , 77) où rj := Diag(— 1, 1, 1, 1). On commence 
par se placer dans une portion de l'espace-temps où le champ gravitationnel est 
faible (loin des trous noirs et étoiles à neutrons). On pourra par exemple se placer 
à proximité d'un corps à compacité faible. En effet, à proximité d'un tel corps, si 
on suppose que l'espace-temps est statique et si on néglige toute autre matière, la 
métrique g est celle de Schwarschild donnée par la formule (1IX.169j) . En particulier, 
cette métrique s'écrit 

g = -dt 2 + dr 2 + r 2 k + h 
où h est le terme d'erreur qui, d'après flIX. 169[) . est égal à 

a ( 1 



et est donc de l'ordre du paramètre de compacité i.e. \h\ = 0(E). Or, la métrique 
— dt 2 + dr 2 + r 2 k est la métrique de Minkowski écrite en coordonnées polaires. Il 
existe donc un système de coordonnées (t ) dans laquelle les composantes 

de la métrique s'écrivent 

où (rj a/3 ) = Diag(— 1, 1, 1, 1) et où les termes d'erreurs sont de l'ordre de S. La forme 
bilinéaire symétrique h peut se voir comme un tenseur sur l'espace de Minkowski 
qui traduit le champ gravitationnel. Cependant, pour que ce raisonnement soit une 
bonne approximation de la réalité physique, il convient que \h\ « 1 et donc que 
S soit suffisamment petit. On admet en général que c'est le cas au voisinage de 
la Terre, du Soleil ou des naines blanches. On prendra garde au fait que ce point 
de vue est assez différent de ce qui se fait habituellement en relativité générale : 
par définition même de la théorie, la champ gravitationnel fait partie intégrante de 
l'espace-temps et est en sens assez inaccessible alors qu'ici, on travaille sur l'espace 
de Minkowski et on extrait en quelque sorte le champ gravitationnel sous forme 
d'un tenseur que l'on peut étudier. 

On va commencer par exprimer l'équation d'Einstein en fonction de h. On écrit 
explicitement le tenseur d'Einstein Rie — ^Rg dans ces coordonnées en utilisant 
l'expression explicite des symboles de Christoffel ainsi que la courbure de Ricci 
p.l88p . On trouve, en notant t = x° pour simplifier les formules et en posant 



h := rf^h. 



G a /3 ■— R a /3 ~ -^Rg 



Af w ( d2h ^ d 2 v d 2 h au \ __ d 2 h 

2 Y 1 V dx^dx» dx a dx>* dx?dx v ) dx a dx? ( IX - 179 ) 
d 2 h d 2 h 
+V dx^dx"^ V V dxPdx^ 
Cette expression est compliquée mais on peut la simplifier en posant 

h a p := h a /3 — -hr] a p. 
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On injecte cette expression dans (1IX.179I) et on obtient 
où l'on a posé 

d 

V ■= irf"h ) 
dx» 



On remarque que le premier terme de l'expression (1IX.180j) n'est autre que nh a p- 
L'équation d'Einstein linéarisée s'écrit donc 

UK fi + rr-Q^rM = 16ïrr 0/3 (IX.181) 

où l'on a noté T a/3 les composantes du tenseur d'énergie-impulsion (qui vaut si 
l'on se trouve à proximité mais pas à l'intérieur du système physique étudié). 

3.2. Jauges de Lorenz et TT. La théorie des jauges est une théorie des 
champs basée sur un groupe de symétries locales, appelé groupe de jauges, définissant 
une invariance de jauge. L'exemple le plus simple est celui de l'électromagnétisme 
de Maxwell. L'idée est de dire que les lois physiques sont les mêmes en tout point 
de l'espace. Mathématiquement, cela revient à dire qu'une loi physique ne doit pas 
dépendre du système de coordonnées dans lequel on travaille. Par extension, on 
parle souvent de jauge lorsqu'on cherche un bon système de coordonnées. C'est 
exactement ce qu'on va faire ici. On va montrer qu'il existe un système de coor- 
données "canonique" pour lequel on aura V a = sur tout le domaine d'étude. On 
obtiendra alors que 

Oh a p = 167TT a(5 . (IX. 182) 

Autrement dit, les coefficients de h sont solutions d'une équation des ondes avec 
second membre. Il faut bien comprendre que cette onde provoque une oscillation 
des coefficients de la métrique : c'est donc l'espace-temps lui-même qui oscille. Par 
ailleurs, en vertu du point 2) de la Remarque IIX.1731 on obtient que les ondes 
gravitationnelles se déplacent à la vitesse de la lumière. 

Passons maintenant à la démonstration du fait qu'il existe un système de co- 
ordonnées permettant d'aboutir à l'équation flIX.1821) . Cela va se faire en deux 



temps : lorsque la condition flIX.1821) est satisfaite, on dira que le potentiel h a p 
vérifie la jauge de Lorenz. Cette terminologie est due au fait que les changements 
de coordonnées que nous mettrons en évidence sont très proches de ceux qui cor- 
respondent à la jauge de Lorenz de l'électromagnétisme. Nous verrons ensuite que 
les systèmes de coordonnées trouvés ne sont pas uniques. Pour obtenir un système 
canonique, nous imposerons des conditions supplémentaires pour lesquelles on dira 
que le potentiel h a p vérifie la jauge TT. 

Partons donc d'un système de coordonnées (t = x°, x 1 , x 2 , x 3 ) comme celui avec 
lequel nous avons travaillé dans le Paragraphe 13.11 Nous définissons un nouveau 
système de coordonnées ( ' ) en posant 

X =2+4 
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où £ Q est une fonction des variables x°, a; 1 , x 2 , x 3 dont les dérivées sont de l'ordre 
des termes d'erreurs. Autrement dit, on cherche des fonctions £ a tel que 



dxl 3 



\h 



<*p\ 



Un tel changement de coordonnées est dit infinitésimal. Avec les lois tensorielles 
de changements de coordonnées, on peut calculer les composantes de la métrique 
g dans les nouvelles coordonnées. On obtient alors que le nouveau terme d'erreur 
vérifie, en ne gardant que les termes d'ordres 1 et en posant Ç a = r} a p£P 

h' h d£ Q djp 

K P - h** dx p dxa 



La trace h' de ce potentiel est donc 

h' = h-2 



dx^ 

Par suite, h a p se transforme de la manière suivante : 



Kp ■- Kp - -hap - - — + g^.VaP 

Le nouveau V a est donc, par définition : 

d 

V = ——{<rf"h! ) 

d 2 f B 2 Ç B 2 £ 

a 1 dx»dx v 1 dx a dx v 1 dx°dx v la>1 ' 

On en déduit que 

VL = v a - n^. 

En particulier, la condition (IIX. 182|) est satisfaite dès que l'on choisit ^ a tel que 

□£« = V a . (IX. 183) 

De telles fonctions existent (voir le point 3 de la Remarque IIX.173|) et ne sont pas 
uniques (voir Paragraphe [3J . 



On a ainsi défini la jauge de Lorenz. Nous n'allons pas entrer dans les détails en ce 
qui concerne la jauge TT. Nous nous contenterons d'énoncer le résultat, qui vaut 
si on se place dans le vide (on suppose que le tenseur d'énergie-impulsion est nul). 
On peut montrer que si on impose de plus que la trace de h soit nulle et que h 
soit transverse à la variable de temps (d'où la terminologie de TT), c'est-à-dire 
que h a p = si a = ou (3 = 0, alors, il existe un unique système de coordonnées 
qui satisfait toutes les conditions. On notera h TT le 2-tenseur symétrique corres- 
pondant. 



4. INFLUENCE DES ONDES GRAVITATIONNELLES SUR LA MATIÈRE 
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3.3. Propriété des coordonnées TT. Considérons maintenant une parti- 
cule qui n'est soumise à aucune autre interaction que l'interaction gravitationnelle. 
Notons 7(r) = (X°(r), X 1 (r), X 2 (t), X 3 (r) ses coordonnées TT, r étant son temps 
propre. Si le champ gravitationnel est nul, c'est-à-dire si h TT est nul alors j(t) est 
une droite de l'espace de Minkowki. Pour simplifier, prenons la particule qui a 
pour coordonnées j(t) = (r, 0,0,0). Si maintenant, on suppose qu'une onde gra- 
vitationnelle arrive à t = 0, on sait que 7 vérifie l'équation des géodésiques. Un 
calcul explicite des symboles de Christoffel en fonction de h TT montre qu'au pre- 
mier ordre on a 

d 2 X\r) _ 
dr 2 

pour i G {1,2,3}. Compte-tenu des conditions initiales X 1 = et (X % )'(0) = 
(puisque l'onde gravitationnelle n'est pas encore arrivée avant t = 0), on trouve 
que les coordonnées d'espace de 7 sont toutes nulles. En particulier, la particule 
reste immobile : c'est une propriété importante des coordonnées TT. Il faut bien 
prendre garde au fait que cette immobilité n'est due qu'au choix des coordonnées 
mais n'a rien de physique. On va au contraire montrer dans le paragraphe suivant 
que l'onde gravitationnelle a une réelle influence sur la matière. 



4. Influence des ondes gravitationnelles sur la matière 

4.1. Influence sur les distances. Nous allons nous placer dans le vide et 
regarder comment les distances varient en présence d'une onde gravitationnelle. 
Pour cela, nous continuons à travailler dans l'espace de Minkowski sur lequel nous 
utiliserons les coordonnées TT. Nous allons considérer deux particules A et B 
et nous noterons L la distance qui les sépare (et qui dépend de t et des termes 
d'erreurs). Nous noterons L leur distance en l'absence d'ondes gravitationnelles. 
Il convient de préciser un peu ces définitions puisque la notion de distance n'est 
pas bien définie en relativité générale. D'abord, nous nous plaçons du point de vue 
d'un observateur attaché à la particule A. Les coordonnées des courbes associées 
à A et B seront notées a(t) = (t, 0,0,0) et b(t) = (t,bi,b 2 ,b 3 ), t étant le temps 
propre des particules. Il faut se rappeler que les coordonnées d'espace ne varient 
pas avec le temps : c'est ce que nous avons vu dans le Paragraphe 13.31 Alors, la 
distance L est définie par 

L := y/UÈ\\ g (IX.184) 



où AB = (0, 61, 62, 63) (voir Figure E]). Ce n'est pas la définition la plus mathémati- 
que que nous pourrions trouver : en effet, il faudrait plutôt prendre la longueur V 
de la géodésique issue de A, passant par B et orthogonale en A à la courbe d'univers 
de A (c'est-à-dire orthogonale à a). Cependant, pour des termes d'erreur h TT 
petits, l'approximation que l'on fait en considérant f lIX.184j) est bonne. Essayons 



de comprendre pourquoi. Pour h TT = 0, les deux définitions coïncident. De plus, 
la différence L — L' est petite devant h TT . En effet, 

- L' est la longueur de la géodésique (AB) pour la métrique g ; 

- L est la longueur de la géodésique (AB) pour la métrique r\. 

Or la longueur des géodésiques dépend des dérivées premières de la métrique puis- 
qu'elle se calcule à partir des symboles de Christoffel. Autrement dit, L — L' est de 
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l'ordre de dérivées de h . Cependant celles-ci sont petites devant h . En effet, 
nous avons vu que tous les raisonnements sont faits dans des conditions physiques 
peu relativistes (espace-temps pas trop "tordu"). En particulier, la métrique de 
Schwarshild est un bon indicateur des ordres de grandeurs. Les termes d'erreurs 
h TT vont être de l'ordre de 1/r tandis que les dérivées de h TT vont être de l'ordre 
de 1/r 2 . Pour finir, on va voir que L — L est de l'ordre de h TT et donc L — L Q et 
L' — L sont équivalents pour des termes d'erreur petits. 




Figure 3. Longueur de A à B 



Pour mesurer la distance L, on aurait pu aussi procéder de manière plus expérimen- 
tale : l'observateur envoie un signal lumineux vers B dont il mesure le temps de 
retour T. Pendant ce trajet, le rayon aura parcouru une distance 2L (du point de 
vue de A) pendant un temps T et à une vitesse de c = 1 (puisque dans la métrique 
77, la vitesse de la lumière est normalisée à 1). Ainsi, la distance L entre A et B est 
donnée par L" = T/2. Il est clair d'après la Figure |3] (où l'on s'est débrouillé que 
pour l'instant où l'observateur émette le rayon lumineux corresponde à t = T/2), 
que L" = L en l'absence d'ondes gravitationnelles, c'est-à-dire lorsque h TT = 0. 
En effet, il suffit d'écrire dans la métrique 77 que : 

= ||I^|| 2 = \\A^À + AÊ\\ 2 = \\A^1\\ 2 + \\A~ê\\ 2 + 2g(À^À,A~ê). 

Maintenant, on voit que \\Â^À\\ = -T/2 = L", \\A~È\\ = L (avec la définition 
( UX.184P pour la métrique 77) et g{A l A, ÂÈ) = 0. 



Si on se place dans la métrique g vont apparaître encore une fois des erreurs prove- 
nant du fait que les géodésiques de type lumière ne sont plus des droites en présence 
d'ondes gravitationnelles mais pour les mêmes raisons que précédemment, ces er- 
reurs seront petites devant h TT . 
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Revenons à la définition (1IX.184I) . que nous conserverons dorénavant. On a 
L 2 = g(ÂÈ, AÈ) = T](XÈ, AÈ) + h TT (lê, AÈ) = L 2 + h TT (À~ê, A~È). 
On écrit An = LqIÎ où ~rt est unitaire pour 77 et on obtient : 

L = L^l + h TT (lt,Tt). 
Autrement dit, au premier ordre : 

L = L (l + \h TT (lt,lt)). 

Ainsi on obtient finalement que 

^ = (IX.185) 

La formule (lIX.185j) montre alors l'influence des ondes gravitationnelles sur les 
longueurs. En particulier, s'il y a une véritable oscillation des coefficients de h TT 
(voir Paragraphe E]) , il y a aussi oscillation de la matière en termes de distances. 

4.2. Coordonnées de Fermi. Jusqu'à présent, nous avons travaillé dans des 
coordonnées "mathématiques" en ce sens qu'elles permettaient de simplifier les for- 
mules. Dans cette section, nous allons montrer qu'il existe des coordonnées plus 
naturelles d'un point de vue physique, c'est-à-dire qui représentent au mieux la 
géométrie de l'espace-temps. On les utilisera dans le Paragraphe 14.31 pour voir 
comment les ondes gravitationnelles font évoluer les formes géométriques. 

En géométrie riemannienne, lorsque l'on veut trouver une carte qui, localement, 
modélise au mieux la géométrie d'une variété, on a envie d'approximer les géodési- 
ques par des droites. C'est par exemple ce que l'on fait sur Terre à notre échelle : 
quand on veut se rendre d'un endroit à un autre, on se déplace en "ligne droite" . 
Mathématiquement, on utilise la carte exponentielle qui transforme les géodésiques 
de la variété en droites de l'espace euclidien. Dans le cadre de la relativité générale, 
il va falloir tenir compte du fait qu'on se place du point de vue d'un observateur et 
que donc, on préférera avoir des systèmes de coordonnées centrés sur une courbe 
plutôt que sur un point. 

Précisons un peu les choses. On travaille toujours sur une variété lorentzienne 
(Ai, g). Le but étant de se ramener à la physique classique, on commence par 
fixer un observateur que l'on modélise par une courbe c : / — > Ai de type temps 
paramétrée par son temps propre (i.e. ||c'(t)|| 3 = 1), / étant un intervalle réel que 
l'on peut supposer contenir 0, ce qui permet de fixer une origine. On peut alors 
définir une carte exponentielle "naturelle" en c(t) exactement de la même manière 
qu'on le fait en géométrie riemannienne. Il suffit de poser 



T cif) M -> M 
X ^ 7x (l) 
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où 7x(l) est l'unique géodésique tel que 7x(0) = c(t) et 7x(0) = X. Pour obtenir 
un système de coordonnées sur A4, il suffit alors de choisir une système de coor- 
données sur T c / t )A4, autrement dit, de choisir une base de T c mA4. Une manière na- 
turelle de le faire est de prendre Çv, ei, où v := c (1) et où (ei, e2, 63) est 

une base orthonormée dans T c mA4 de l'espace £ c ( t ) := (^ectc^t))- 1 . La propriété 
principale de cette carte est comme en géométrie riemannienne qu'elle transforme 
les géodésiques qui passent par c(t) en droites. Le problème que nous avons main- 
tenant est que nous voulons mesurer l'évolution d'un phénomène dans le temps 
mesuré par l'observateur c. On pourrait alors considérer une famille de cartes expo- 
nentielles mais on se rend bien compte que les formules de changements de cartes 
vont donner des résultats compliqués. Pour prendre en compte la notion d'observa- 
teur, on va fixer une fois pour toutes (v(0), e\ (0), ëf (0), e% (0)) un système ortho- 
normé comme ci-dessus, c'est-à-dire que v(0) = c'(0) et que (ei (0), ëf (0), e% (0)) 
est une base orthonormée dans T c ^Ai de l'espace £ c ( ) := (Vectc'^O)) 1 . On 
construit ensuite fëi(t), e-i (t), ëf (t)) en chaque c(t) en prenant le transport pa- 
rallèle de (ëi(0), e2(0), 63(0)) le long de c. On obtient un système de coordonnées 
(£, x 1 , x 2 , x 3 ) défini sur un voisinage de la courbe c en restreignant pour tout t la 
carte exponentielle à £ c (t)- Plus précisément, le point de coordonnées {t, x 1 , x 2 , x 3 ) 
représentera le point exp c ( t )(a; 1 ëi (t) + x 2 ë^{t) + x i 'ët > {t)) de Ai. Ce système de 
coordonnées est appelé système de coordonnées de Fermi. Dans ces coordonnées, 
toute géodésique orthogonale à c sera représentée par une droite alors que dans la 
carte exponentielle habituelle, ce sont seulement les géodésiques passant par c(t) 
(le point en lequel on a construit la carte exponentielle) qui sont représentées par 
des droites. 

4.3. Formes géométriques et ondes gravitationnelles. Dans ce para- 
graphe, nous étudions comment les formes géométriques sont transformées sous 
l'influence des ondes gravitationnelles. Pour cela, nous allons nous placer dans les 
coordonnées TT (x° = t, x 1 , x 2 , x 3 ) (et donc dans le vide) et considérer que l'onde 
est monochromatique et se déplace dans la direction de l'axe des x 3 . Rappelons 
que, d'après le Paragraphe I2.2[ faire de telles restrictions n'est pas vide de sens. 
On suppose donc que h TT s'écrit sous la forme 

h TT = A cos(wt - A;x 3 ) (IX. 186) 

où A est une matrice fixe et w, k G M, le nombre w étant la fréquence de l'onde. 
Puisque les coefficients de h TT sont solutions de Oti£E = 0, on a k 2 = u 2 . On va 
fixer k = u, ce qui ne restreint pas la généralité. Rappelons maintenant que par 
définition des coordonnées TT, on a : 

(1) tr(h TT ) = et donc tr(A) = ; 

(2) /igj = et donc A 0a = pour tout a ; 

(3) h TT vérifie la condition de jauge de Lorenz et donc -^(v^hau) = P our 
tout a. 

Cette dernière condition se réécrit en tenant compte de (1IX.186jh 

= »T4, u^rcœ(cj(t-D) 
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et donc, en divisant par l'exponentielle 

= Tf v A av u(b^ - 5^) = -oo(A a0 + A a3 ). 

Compte-tenu du fait que A 0a = pour tout a, on obtient que A a3 = pour tout 
a. Puisque A est symétrique et de trace nulle, on obtient finalement qu'il existe 
a+, a x G E tels que 
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Les coefficients 







a + cos(u(t — x 3 )) 
a x cos(u(t — x 3 )) 




\ 

a x cos(u;(t — x 3 )) 

— a + cos(w(t — x 3 )) 

o o. y 



h + {t — x 3 ) = a + cos(u(t — x 3 )) et h x (t — x 3 ) = a x cos(co(t — x 3 )) 

de h TT sont appelés les modes de polarisation chromatique de l'onde gravitation- 
nelles. 



Remarque IX. 187. Les équations d'Einstein linéarisées forment un système de 
10 équations (une pour chaque coefficient de h TT et en tenant compte du fait que 
h TT est symétrique). Avec les considérations précédentes, on s'est ramenés à ne 
garder que deux degrés de libertés correspondant aux nombres a + et a x . On peut 
montrer qu'il n'est pas possible de faire mieux. 

On a dans les coordonnées TT : 

g a p = Vap + hlp + 0(\x\ 2 ). 

Notons O l'observateur de coordonnées (t, 0, 0, 0) et définissons les coordonnées de 
Fermi (y y 1 , y 2 , y 3 ) centrées sur O. Leur définition implique qu'en un point de 
coordonnées spatiales nulles, la métrique g a la forme suivante : 

9 a p = Vafs + 0(\x\ 2 ). 

Prenons une particule de coordonnées TT spatiales (a 1 , a 2 , a 3 ). Rappelons que 
ces coordonnées ne dépendent pas du temps d'après le Paragraphe 13.31 Notons 
(t, b 2 (t), b 3 (t)) les coordonnées de sa courbe associée. En comparant l'expres- 
sion de la métrique dans les deux systèmes de coordonnées, on déduit que 

6 i (t)=a i + ^g r (t,0,0,oy'. 

Ainsi, on obtient en revenant à la forme explicite de h TT 

= a 1 + ^(a+a 1 + a x a 2 ) cos(a;t) 
b 2 (t) = a 2 + | (axa 1 — a + a 2 ) cos(a;t) 
b 3 (t) = a 3 . 
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On voit alors qu'en prenant par exemple a + = 1, a x =0 (pour fixer les choses), 
un ensemble de particules disposées en cercle dans le plan spatial x 3 = b 3 sera 
déformé comme sur la Figure Hl En effet, les équations deviennent 

b l {t) = a 1 (1 + \ cos(wi)] 
b 2 {t) = a 2 (l- |cos(w*). 

En particulier, si les coordonnées TT des particules décrivent le cercle d'équation 
(a 1 ) 2 + (a 2 ) 2 = 1, on aura l'équation suivante dans les coordonnées (b 1 (t) , b 2 (t)) : 

" ^(t)) 2 + t : 1 ; xx2 (&W = 1 



| cos(ut)Y 



(l + |cos(w*)) (1 
qui est une ellipse de sommets (± (l + ~ cos(u;i)) , 0), (0, ± (l + ~ cos(u;i))). 




t=o 



t=T/4 



t=T/2 



t=3T/4 



t=T 



Figure 4. Déformation d'un cercle au passage d'une onde mono- 
chromatique de période T := 2-k/u (avec a + — 1, a x — 0) 



5. Un point sur la situation 

Dans les sections précédentes, beaucoup de calculs ont été fait mais il convient de 
faire un point sur la situation pour bien comprendre ce qu'ils signifient. Nous avons 
montré qu'il existe un difféomorphisme (donné par les coordonnées TT) $ : U — > V 
où V est un ouvert de l'espace-temps, U est un ouvert de l'espace de Minkowski 
tel que la métrique sur M 4 a la forme suivante au premier ordre : 

$ _1 5f = rj + h 

où est un TT-tenseur, c'est-à-dire un 2-tenseur symétrique transverse à trace nul. 
Changer la métrique dans l'espace-temps revient à se donner un autre tenseur h. 
Il faut bien noter que tous les termes d'ordre 2 ont été négligés. Par ailleurs, on 
peut se demander si ces ondes gravitationnelles sont de "vraies" ondes : autrement 
dit, sont-elles véritablement oscillantes ? Sur l'exemple explicite de Schwarschild, la 
forme explicite de h montre bien que ce n'est pas le cas ce qui n'est pas étonnant : on 
est en présence d'un système statique. Pour prendre l'analogie avec la surface d'un 
lac, il est évident qu'une pierre lancée dans l'eau va produire une onde alors que la 
même pierre immobile au fond de l'eau n'en produira pas : c'est le mouvement qui 
produit des oscillations. D'ailleurs, il faut remarquer que mathématiquement, une 
solution de l'équation des ondes n'est pas nécessairement oscillante (les constantes 
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sont solutions par exemple. Malgré tout, comment mesurer l'influence véritable 
d'une onde ? D'abord, comme nous l'avons vu, les ondes gravitationnelles sont ob- 
tenues comme des solutions d'équations des ondes dont nous connaissons le second 
membre : il s'agit d'une tenseur d'énergie-impulsion. Or, on sait écrire explicite- 
ment les solutions de telles équations. En se plaçant dans des conditions physiques 
peu relativistes (longueur d'onde grande devant la masse de la matière observée), 
on peut négliger des termes, ce qui simplifie les calculs et on peut montrer que 



où / est une fonction que nous n'écrirons pas explicitement ici et où Q est appelé 
moment quadrupolaire de masse et est défini par 



Ici, p est la densité d'énergie du tenseur d'énergie-impulsion. Il s'agit d'une intégrale 
spatiale à t constant qui a un sens puisque la situation est supposée peu relativiste. 
Ce résultat dit que les ondes gravitationnelles vont être produites lorsque Q" est 
non nul. De par la définition de Q, c'est le mouvement (et même l'accélération) 
de matière qui provoque des dérivées seconde de Q. En particulier, les systèmes 
physiques les plus à même de produire des ondes gravitationnelles détectables sont 
les systèmes binaires (composés de deux étoiles en rotation et qui tendent à s'ef- 
fondrer) ou les pulsars (étoiles en rotation). 



Détecter expérimentalement les ondes gravitationnelles est l'un des défis majeurs 
de la cosmologie actuelle. Il y a principalement trois raisons à cela. D'abord, 
cela donnerait une nouvelle confirmation de la théorie de la relativité générale. 
Bien évidemment, elle a déjà obtenu de telles confirmations mais il s'agit là de 
phénomènes bien plus fins et qui pourraient montrer que la relativité n'est pas une 
théorie qui n'est qu' approximativement vraie. Une autre raison serait de cartogra- 
phier les ondes gravitationnelles du Big-Bang. On a de nombreux moyens d'étudier 
les débuts de l'univers. Nous avons notamment parlé du rayonnement cosmique qui 
donne une photographie des premiers instants de l'univers. Cependant, en raison 
des températures extrêmes qui régnaient alors, l'univers était opaque jusqu'à en- 
viron 300000 ans après le Big-Bang (avec toutes les réserves habituelles que l'on 
doit se donner dès que l'on évoque la notion de temps absolu). C'est donc une 
photographie de cette période que fournit le rayonnement cosmique. En détectant 
les ondes gravitationnelles prouites par le Big-Bang, il semble possible d'obtenir 
des images assez précises d'instants beaucoup plus lointains. Pour finir, la matière 
est très perméable aux ondes gravitationnelles et leur étude pourrait permettre 
de comprendre des processus astrophysiques qui nous sont pour l'instant inacces- 
sibles, comme par exemple ce qui se passe à l'intérieur des étoiles. C'est pourquoi 
les projets franco- italien VIRGO, américain LIRGO et américano-européen LISA, 
actuellement en construction, qui ont pour but de détecter les ondes gravitation- 
nelles, ont vu le jour. 




x\) 
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3 km 



V 




3 km 



Figure 5. VIRGO 

VIRGO, LIRGO et LISA sont des appareils appelés interféromètres. L'idée est très 
simple : on construit deux "bras" orthogonaux -ceux de VIRGO mesurent 3 km 
- dont on est capable de mesurer la distance avec une très grande précision grâce 
à des lasers (voir Figure [5]). Au passage d'une onde gravitationnelle, la Figure 
H] montre que les deux bras orthogonaux vont subir de très petites déformations 
de longueur qui seront différentes et qui permettront de déterminer la direction 
de propagation de l'onde (un seul bras aurait permis de détecter seulement la 
fréquence et l'amplitude). Par exemple, avec l'étude faite dans le Paragraphe I4.3[ 
on voit que si seul un des deux bras oscille au passage d'une onde gravitationnelle 
monochromatique, on peut en déduire que l'onde se propage dans la direction du 
bras immobile. 

7. Ondes gravitationnelles et conjecture de la censure cosmique 

On peut montrer que les ondes gravitationnelles possèdent de l'énergie et de l'im- 
pulsion. En particulier, elles font perdre de l'énergie aux systèmes physiques qui 
en émettent. Pour illustrer cette perte d'énergie, imaginons l'expérience suivante. 
Mettons de manière théorique un corps dense en rotation rapide. On pourrait 
espérer que ce corps va s'effondrer en une singularité de type Kerr qui puisque la 
rotation est suffisamment rapide, va donner lieu à une singularité nue correspon- 
dant au cas a 2 > M 2 du Chapitre [3j On peut donc espérer nier la conjecture de 
la censure cosmique en faisant des simulations numériques de ce type de situa- 
tion. Cela a été fait et on s'aperçoit que les ondes gravitationnelles font perdre de 
l'énergie au système, ralentissant ainsi sa rotation, et aboutissant à la formation 
d'un trou noir et non pas d'une singularité nue. 



ANNEXE A 



Quelques précisions sur la géométrie lorentzienne 

Ce paragraphe a pour but de préciser les notions de géométrie riemannienne qui 
gardent un sens en géométrie lorentzienne et celles qui au contraire, sont spécifiques 
à la géométrie riemannienne. 

1. Variétés lorentziennes, courbures, géodésiques 

Pour une introduction rapide à la géométrie différentielle et au calcul tensoriel, on 
pourra par exemple voir [Heb97j. 

Définition. Une variété lorentzienne (Ai, g) est une variété Ai de dimension 4 
munie d'un champ de tenseurs g (appelé métrique lorentzienne) deux fois covariant 
tel que pour tout p G Ai, g p est une forme bilinéaire symétrique de signature 
(— , +, +, +) définie sur l'espace tangent T m Ai. 

On peut montrer que toute variété de classe C k (k > 2) de dimension 4 para- 
compacte et non compacte admet une métrique lorentzienne de classe C* -1 . Par 
contre, si la variété est compacte, il faut et il suffit que sa caractéristique d'Euler- 
Poincaré soit nulle, ce qui est assez restrictif (par exemple, le tore T 4 admet une 
telle structure alors la sphère S A n'en admet pas). 

Remarque importante : Une variété lorentzienne est métrisable mais ce n'est 
pas un espace métrique. Autrement dit, il n'existe pas de métrique canonique 
donnant la topologie de Ai. En particulier les notions de parties bornées, suites 
de Cauchy (et donc de variété lorentzienne complète) n'ont pas de sens. 

Soit (Ai, g) une variété lorentzienne. Comme en géométrie riemannienne, il existe 
une unique connexion à torsion nulle et pour laquelle g est parallèle (voir |Heb97] 
pour les définitions de ces notions). Cette connexion est appelée connexion de Levi- 
Civita ou connexion lorentzienne de g. Notons D cette connexion. Soit (x 1 , ■ ■ ■ , x A ) 
une carte. Définissons les symboles de Christoffel de la métrique par D_a_-j$-r = 

r^ôffe. Alors comme dans le cas riemannien, on a 

r«= \ {di9 j i + d j g li -d l g ij )g kl . 

Notons qu'il est naturel de travailler en coordonnées parce que dans les situations 
que nous serons amenés à étudier, on aura bien souvent une carte plus ou moins 
canonique. 

Définition. 
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(1) Soit D une connexion. Le champ de tenseurs R trois fois covariant et une 
fois contravariant défini par 

R(X, Y)Z = D X D Y Z - D Y D X Z - D [xy] Z 

est appelé tenseur de courbure de la connexion. Lorsque D est la connexion 
lorentzienne, R est appelé la courbure lorentzienne. 

(2) Si D est la connexion lorentzienne, le champ de tenseurs deux fois cova- 
riant donné par 

Rij = Rikj 

est appelé courbure de Ricci de la métrique g. 

(3) La fonction 

R = R^i 

est appelée courbure scalaire de la métrique g. 
Soit (xi, • • • ,X4) une carte de Ai. Alors, comme dans le cas riemannien, on a 

R afj = diT l af} - dpT l ai + r™ - r^ m r™. (i.iss) 

Remarque : Sur une variété lorentzienne, on ne peut pas définir la courbure 
sectionnelle. En effet, dans la définition riemannienne de la courbure sectionnelle, 
on divise par g(X, X)g(Y, Y) — g(X,Y) 2 . Dans le cas riemannien, ce terme est 
toujours non nul alors qu'en lorentzien, ce n'est plus le cas. 

Définition. Un chemin différentiable c : / — > A4 (I est un intervalle de R) est une 
géodésique si pour tout t G /, -D c '(t)c' = où d est le champ de vecteurs tangents 
le long de la courbe c. 

Remarque 1.189. Une géodésique de type temps ou espace sera paramétrée par 
la longueur. Il faut remarquer que l'équation des géodésiques impose aussi un 
paramétrage particulier (on parle de paramétrage affine pour les géodésiques de 
type lumière). Tous ces paramétrages se déduisent les uns des autres par une 
transformation affine. Ce point est très important : il permet par exemple de 
donner un sens à l'incomplétude des géodésiques de type lumière. 

Il découle du théorème de Cauchy-Lipschitz qu'il existe toujours une unique géodé- 
sique maximale dès que l'on fixe une condition initiale c(0) = p et c'(0) = v (où 
v G T p Ai). On peut montrer les deux résultats suivants : 

THÉORÈME 1.190. Soit {Ai, g) une variété lorentzienne munie de sa connexion 
lorentzienne. Si une courbe c : [a, b] — > Ai, C 1 par morceaux de type temps réalise 
le maximum de pseudo-longueur (définie par l(c) = y 1 —g{c ' , d) ) entre c(a) et 
c(b) parmi toutes les courbes de genre temps joignant ces deux points, alors c 'est 
une géodésique. 

On a une réciproque locale à ce théorème : 

THÉORÈME 1.191. Soit (Ai, g) une variété lorentzienne munie de sa connexion 
lorentzienne. Pour tout p G Ai, il existe un voisinage V p géodésiquement convexe 
tel que pour tout q,r G V p q et r peuvent être joints par une géodésique de type 
temps ou isotrope qui réalise le maximum de pseudo-longueur parmi les courbes de 
type temps ou isotropes joignant q à r. 
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Hypersurfaces de Ai : 

Définition. Soit (Ai, g) une variété lorentzienne et N une hypersurface de Ai. 
On dit que N est de type espace (resp. de type temps, resp. isotrope) si en tout 
point p G iV les vecteurs orthogonaux sont de type temps (resp. de type espace, 
resp. isotropes). 

Remarque 1.192. Les vecteurs tangents à une hypersurfaces de type espace sont 
de type espace mais les vecteurs tangents à une hypersurface de type temps ou 
isotrope peuvent être des trois types. 

PROPOSITION 1.193. Soit (Ai, g) une variété lorentzienne et N une hypersur- 
face de Ai. Notons G la restriction de g à TN. Alors, 

- Si N est type espace, G est définie positive en tout point de N et par conséquent 
(N, G) est une variété riemannienne. 

- Si N est de type temps, G est de signature (—, +, +) en tout point de N. 

- Si N est isotrope, G est dégénérée en tout point de N. 



Soit (Ai, g) une variété lorentzienne orientée (au sens classique, pas orientée en 
temps comme on l'a défini dans le chapitre HT]) . 

Définition. La forme volume rj est l'unique 4-forme différentielle sur Ai qui vérifie, 
pour une carte quelconque ( ) dans l'orientation de Ai 



(si Ai n'est pas orientable, on peut se limiter à des domaines ouverts orientables 
et les orienter). La démonstration de l'existence et l'unicité de rj est identique à 
l'analogue en géométrie riemannienne (sauf qu'ici det(^y) < 0)). On obtient ainsi 
sur une variété lorentzienne orientée (de la même manière que sur une variété 
riemannienne) une mesure de Radon positive en posant : pour tout / : Ai — > M 
continue à support compact, 



Si Ai n'est pas orientable, on peut, comme en géométrie riemannienne définir une 
mesure de Radon positive canonique en travaillant localement. Par contre, la forme 
ï] n'existera pas dans ce cadre. 

Soit N est une hypersurface orientée dans Ai. Notons G la restriction de g à TN. 



- Si N est de type espace, la métrique G définit sans ambiguïté la forme volume 
et la mesure de Radon positive riemannienne. 

- Si N est de type temps, la métrique G est de signature (— , +, +) et définit sans 
ambiguïté une forme volume et une mesure de Radon positive construites sur 
une variété de dimension 3 exactement comme ci-dessus. 
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Définition. Soit p G N. Le vecteur orthogonal unitaire est l'unique v G T p Ai 
compatible avec les orientations de Ai et N, orthogonal à N et tel que g(v p , v p ) = 
— 1 (resp. g(v p ,Vp) = 1) si N est de type espace (resp. de type temps). 

Remarque 1.194. Cette notion n'a pas de sens si N est isotrope car alors la 
direction orthogonale est isotrope également. 

Définition. Soit X un champ de vecteurs continu sur Ai. Le flux de X à travers 
N est l'intégrale 

- f N g(v,X) si N est de type espace; 

- J N g(v,X) si N est de type temps. 

Ici, v est le champ des vecteurs orthogonaux unitaires à X. 

Soit maintenant un domaine ouvert orienté Q tel que Q soit une variété à bord 
lipschitzienne compacte. On suppose que l'ensemble des points p de dQ au voisinage 
desquels dfl n'est pas C 1 est de mesure nulle dans dQ (la notion "de mesure nulle" 
est intrinsèque sur une variété). 

THÉORÈME 1.195. (Stokes-Gauss) On suppose que dfl est de type espace ou de 
type temps. Soit X un champ de vecteurs C 1 sur Q. Alors, 



où l'on a pris sur dQ l'orientation induite par Q et où e = — 1 (resp. e = 1) si N 
est de type espace (resp. temps) 

Remarque 1.196. Si dQ n'est pas d'un type unique ou possède des parties 
isotropes de mesure non nulle, on peut quand même énoncer le théorème. Voir 




div(X) = e / g(v,X) = flux de X à travers dQ 




[Haw73j. 
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